画像の大部分が欠落している場合でも、新しいモデル CM-GAN は全体的な構造とテクスチャの詳細を考慮して、リアルに復元できます。
画像の復元とは、画像の欠落した領域を補完することを指します。これは、コンピューター ビジョンの基本的なタスクの 1 つです。この方向には、オブジェクトの削除、画像のリターゲティング、画像の合成など、多くの実用的な用途があります。
初期の修復方法は、画像の欠落部分を埋めるための画像ブロック合成または色の拡散に基づいていました。より複雑な画像構造を実現するために、研究者はデータ駆動型のアプローチに目を向けており、深い生成ネットワークを利用してビジュアルコンテンツと外観を予測しています。生成修復モデルは、大規模な画像セットでトレーニングし、再構築と敵対的損失を利用することで、自然画像や人間の顔などのさまざまな種類の入力データに対して、より視覚的に魅力的な結果を生成することが示されています。
しかし、既存の作品は単純な画像構造を完成させる場合にのみ良好な結果を示すことができ、複雑な全体構造と高いディテール忠実度を備えた画像コンテンツを生成することは依然として大きな課題です。穴が大きい。
本質的に、画像修復は 2 つの重要な問題に直面しています: 1 つはグローバル コンテキストを不完全な領域に正確に伝播する方法であり、もう 1 つはグローバル キューと一致する実際のローカル パーツを合成することです。 。グローバルなコンテキスト伝播の問題を解決するために、既存のネットワークは、エンコーダ - デコーダ構造、アトラス畳み込み、コンテキスト アテンション、またはフーリエ畳み込みを利用して、長距離の特徴依存関係を統合し、有効な受容野を拡張します。さらに、2 段階のアプローチと反復的な穴埋めは、大まかな結果の予測に依存して全体的な構造を強化します。ただし、これらのモデルには、マスクされていない領域の高レベルのセマンティクスを取得し、それらを効果的にホールに伝播して全体的なグローバル構造を合成するメカニズムが欠けています。
これに基づいて、ロチェスター大学と Adobe Research の研究者は、新世代ネットワーク CM-GAN (カスケード変調 GAN) を提案しました。これは、全体の構造を地理的により適切に合成し、地元の詳細。 CM-GAN には、穴のある入力画像からマルチスケールの特徴表現を抽出するためのフーリエ畳み込みブロックを備えたエンコーダーが含まれています。 CM-GAN には 2 ストリーム デコーダもあり、各スケール レイヤーに新しいカスケード グローバル空間変調ブロックを設定します。
各デコーダ ブロックでは、まずグローバル変調を適用して粗く意味を意識した構造合成を実行し、次に空間変調を実行して空間適応的な方法で特徴マップをさらに調整します。さらに、この研究では、現実のシーンでの物体除去タスクのニーズを満たすために、空洞内のアーティファクトを防ぐための物体知覚トレーニングスキームを設計しました。この研究では広範な実験が行われ、CM-GAN が定量的評価と定性的評価の両方で既存の方法よりも大幅に優れていることが示されました。
- #論文アドレス: https://arxiv.org/pdf/2203.11947.pdf
- プロジェクトアドレス: https://github.com/htzheng/CM-GAN-Inpainting
##CM-GAN はより優れたグローバル構造を合成できます:
画像補完のグローバルなコンテキストをより適切にモデル化するために、この研究では、グローバル コード変調と空間コード変調をカスケード接続する新しいメカニズムを提案します。このメカニズムは、グローバル コンテキストを空間ドメインに適切に挿入しながら、部分的に無効なフィーチャを処理するのに役立ちます。新しいアーキテクチャ CM-GAN は、以下の図 1 に示すように、全体の構造と局所的な詳細を適切に合成できます。
を生成します。
からグローバル スタイル コードを抽出します。次に 正規化。さらに、MLP ベースのマッピング ネットワークは、画像生成のランダム性をシミュレートするためにノイズからスタイル コード w を生成します。コード w は s と結合されてグローバル コード g = [s; w] が生成され、これは後続の復号化ステップで使用されます。
さらに、この研究では、安定した修復タスクの敵対的トレーニングに特化したマスク R_1 正則化も提案しています。マスク m は、マスク外の勾配ペナルティの計算を回避するために利用されます。
実験
この研究では、Places2 データセットに対して 512 × 512 の解像度で画像修復実験を実施し、モデルの定量的な結果を示しました。そして定性的な評価結果。
定量的評価: 以下の表 1 は、CM-GAN と他のマスキング手法を比較しています。結果は、CM-GAN が FID、LPIPS、U-IDS、および P-IDS の点で他の方法よりも大幅に優れていることを示しています。 LaMa の知覚損失の助けにより、CM-GAN は、事前トレーニングされた知覚モデルによって提供される追加のセマンティック ガイダンスのおかげで、CoModGAN や他の方法よりも大幅に優れた LPIPS スコアを達成します。 LaMa/CoModGAN と比較して、CM-GAN は FID を 3.864/3.724 から 1.628 に削減します。
以下の表 3 に示すように、微調整の有無にかかわらず、CM-GAN は LaMa およびCoModGAN マスク どちらも LaMa および CoModGAN よりも大幅に優れたパフォーマンス向上を達成しており、このモデルが一般化機能を備えていることを示しています。 CoModGAN マスク、オブジェクト認識マスクでトレーニングされた CM-GAN のパフォーマンスが依然として CoModGAN マスクのパフォーマンスより優れていることは注目に値します。これは、CM-GAN の生成能力が優れていることを裏付けています。
#モデル内の各コンポーネントの重要性を検証するために、この研究では一連のアブレーション実験を実施し、すべてのモデルは Places2 データセットでトレーニングおよび評価されました。アブレーション実験の結果を以下の表 2 および図 7 に示します。
##
以上が画像の大部分が欠落している場合でも、新しいモデル CM-GAN は全体的な構造とテクスチャの詳細を考慮して、リアルに復元できます。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック











AppleIDを使用してiTunesStoreにログインすると、「このAppleIDはiTunesStoreで使用されていません」というエラーが画面に表示される場合があります。心配するようなエラー メッセージはありません。これらのソリューション セットに従って問題を修正できます。解決策 1 – 配送先住所を変更する iTunes Store にこのプロンプトが表示される主な理由は、AppleID プロファイルに正しい住所がないことです。ステップ 1 – まず、iPhone で iPhone 設定を開きます。ステップ 2 – AppleID は他のすべての設定の最上位にある必要があります。それで、開けてください。ステップ 3 – そこに到達したら、「支払いと配送」オプションを開きます。ステップ 4 – Face ID を使用してアクセスを確認します。ステップ

前回のパーティーでは素晴らしい写真をいくつか撮ったのですが、残念ながら、撮った写真のほとんどが赤目でした。写真自体は素晴らしいのですが、赤い目が写っているとイメージが台無しになってしまいます。言うまでもなく、パーティーの写真の中には友達の携帯電話からのものもあるかもしれません。今回は写真から赤目を除去する方法を見てみましょう。写真の目が赤い原因は何ですか?フラッシュを使用して写真を撮影すると、赤目が発生することがよくあります。これは、フラッシュの光が目の奥に直接当たるため、目の下の血管が光を反射し、目が赤く写ってしまうためです。幸いなことに、技術の継続的な進歩により、一部のカメラにはこの問題を効果的に解決できる赤目補正機能が搭載されています。この機能を使用すると、カメラは写真を撮影します

Win11 ユーザーが資格情報を使用してログインすると、資格情報を検証できないことを示すエラー メッセージが表示されます。何が起こっているのでしょうか?編集者がこの問題を調査した結果、この問題を直接的または間接的に引き起こすいくつかの状況が考えられることがわかりました。編集者と一緒に見てみましょう。

多くの友人は、コンピューターのオペレーティング システムを使用するときに常にブルー スクリーンに遭遇します。最新の win11 システムでもブルー スクリーンの運命から逃れることはできません。そこで、今日は win11 のブルー スクリーンを修復する方法についてのチュートリアルをお届けしました。ブルー スクリーンに遭遇したかどうかに関係なく、必要な場合に備えて最初にそれを学ぶことができます。 win11 ブルースクリーンを修正する方法 方法 1. ブルースクリーンが発生した場合は、まずシステムを再起動し、正常に起動できるかどうかを確認します。 2. 正常に起動できる場合は、デスクトップ上の「コンピュータ」を右クリックし、「管理」を選択します。 3. 次に、ポップアップウィンドウの左側にある「システムツール」を展開し、「イベントビューア」を選択します。イベント ビューアを使用すると、ブルー スクリーンの原因となった特定の問題がわかります。 5. 次に、ブルー スクリーンの状況とイベントに従ってください。

PHP 500 エラーの包括的なガイド: 原因、診断、および修正 PHP 開発中に、HTTP ステータス コード 500 のエラーが頻繁に発生します。このエラーは通常「500InternalServerError」と呼ばれ、サーバー側でのリクエストの処理中に不明なエラーが発生したことを意味します。この記事では、PHP500 エラーの一般的な原因、診断方法、修正方法を検討し、参照用の具体的なコード例を示します。 1.500 エラーの一般的な原因 1.

1. win + r キーを押してファイル名を指定して実行ウィンドウを開き、「regedit」と入力して Enter キーを押してレジストリ エディターを開きます。 2. 開いたレジストリエディタで[HKEY_LOCAL_MACHINESOFTWAREMicrosoftWindowsCurrentVersionRun]をクリックして展開し、右側の空白部分を右クリックして[新規 - 文字列値]を選択し、名前を[systray.exe]に変更します。 3. systray.exeをダブルクリックして開き、数値データを「C:WindowsSystem32systray.exe」に変更し、[OK]をクリックして設定を保存します。

Windows 11 または Windows 10 にアップグレードした後に aksfridge.sys ブルー スクリーン エラーが発生した場合、この記事では解決策を提供します。この問題を正常に解決するには、次の方法を試してください。本物の aksfridge.sys ファイルは、AladdinKnowledgeSystems の AladdinHASP のソフトウェア コンポーネントです。 AladdinHASP (Hardware Anti-Software Piracy) は、デジタル著作権管理 (DRM) 保護およびライセンス ソフトウェアのスイートです。 Aksfridge.sys は、HASP が適切に機能するために必要なフィルター ドライバーです。このコンポーネントは、特殊な外部デバイスのサポートを追加します。ハードウェア アンチソフトウェア 著作権侵害 (AladdinHAS とも呼ばれます)

コンピュータの起動後に頻繁にブルー スクリーンが表示される場合は、Windows システムによって csrss.exe ファイルに対して発生する重大なエラー (停止コード 0xF4) が原因である可能性があります。では、それを修正する方法を見てみましょう! csrss.exe のブルー スクリーンを修正する方法 まず、「Ctrl+Alt+Del」キーを同時に押します。このとき、Microsoft Windows タスク マネージャーのインターフェイスがポップアップ表示されます。 「タスクマネージャー」タブをクリックすると、実行中のすべてのプログラムとそれらが占有するリソース、その他の情報が画面に一覧表示されます。もう一度クリックして「プロセス」タブに入り、「イメージ名」をもう一度クリックして、リストで「csrss.exe」ファイルを見つけます。 「プロセスの終了」ボタンをクリックします
