画像の大部分が欠落している場合でも、新しいモデル CM-GAN は全体的な構造とテクスチャの詳細を考慮して、リアルに復元できます。-AI-php.cn

実験

ホームページ

テクノロジー周辺機器

画像の大部分が欠落している場合でも、新しいモデル CM-GAN は全体的な構造とテクスチャの詳細を考慮して、リアルに復元できます。

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Apr 08, 2023 pm 05:41 PM

画像ネットワークの生成修理

画像の復元とは、画像の欠落した領域を補完することを指します。これは、コンピュータービジョンの基本的なタスクの 1 つです。この方向には、オブジェクトの削除、画像のリターゲティング、画像の合成など、多くの実用的な用途があります。

初期の修復方法は、画像の欠落部分を埋めるための画像ブロック合成または色の拡散に基づいていました。より複雑な画像構造を実現するために、研究者はデータ駆動型のアプローチに目を向けており、深い生成ネットワークを利用してビジュアルコンテンツと外観を予測しています。生成修復モデルは、大規模な画像セットでトレーニングし、再構築と敵対的損失を利用することで、自然画像や人間の顔などのさまざまな種類の入力データに対して、より視覚的に魅力的な結果を生成することが示されています。

しかし、既存の作品は単純な画像構造を完成させる場合にのみ良好な結果を示すことができ、複雑な全体構造と高いディテール忠実度を備えた画像コンテンツを生成することは依然として大きな課題です。穴が大きい。

本質的に、画像修復は 2 つの重要な問題に直面しています: 1 つはグローバルコンテキストを不完全な領域に正確に伝播する方法であり、もう 1 つはグローバルキューと一致する実際のローカルパーツを合成することです。。グローバルなコンテキスト伝播の問題を解決するために、既存のネットワークは、エンコーダ - デコーダ構造、アトラス畳み込み、コンテキストアテンション、またはフーリエ畳み込みを利用して、長距離の特徴依存関係を統合し、有効な受容野を拡張します。さらに、2 段階のアプローチと反復的な穴埋めは、大まかな結果の予測に依存して全体的な構造を強化します。ただし、これらのモデルには、マスクされていない領域の高レベルのセマンティクスを取得し、それらを効果的にホールに伝播して全体的なグローバル構造を合成するメカニズムが欠けています。

これに基づいて、ロチェスター大学と Adobe Research の研究者は、新世代ネットワーク CM-GAN (カスケード変調 GAN) を提案しました。これは、全体の構造を地理的により適切に合成し、地元の詳細。 CM-GAN には、穴のある入力画像からマルチスケールの特徴表現を抽出するためのフーリエ畳み込みブロックを備えたエンコーダーが含まれています。 CM-GAN には 2 ストリームデコーダもあり、各スケールレイヤーに新しいカスケードグローバル空間変調ブロックを設定します。

各デコーダブロックでは、まずグローバル変調を適用して粗く意味を意識した構造合成を実行し、次に空間変調を実行して空間適応的な方法で特徴マップをさらに調整します。さらに、この研究では、現実のシーンでの物体除去タスクのニーズを満たすために、空洞内のアーティファクトを防ぐための物体知覚トレーニングスキームを設計しました。この研究では広範な実験が行われ、CM-GAN が定量的評価と定性的評価の両方で既存の方法よりも大幅に優れていることが示されました。

画像の大部分が欠落している場合でも、新しいモデル CM-GAN は全体的な構造とテクスチャの詳細を考慮して、リアルに復元できます。

プロジェクトアドレス: https://github.com/htzheng/CM-GAN-Inpainting

まずは画像修復効果を見てみましょう。他の方法と比較して、CM -GAN はより優れたテクスチャを再構築できます:

画像の大部分が欠落している場合でも、新しいモデル CM-GAN は全体的な構造とテクスチャの詳細を考慮して、リアルに復元できます。

##CM-GAN はより優れたグローバル構造を合成できます:

画像の大部分が欠落している場合でも、新しいモデル CM-GAN は全体的な構造とテクスチャの詳細を考慮して、リアルに復元できます。

##CM-GAN はより優れたオブジェクト境界を備えています:

画像の大部分が欠落している場合でも、新しいモデル CM-GAN は全体的な構造とテクスチャの詳細を考慮して、リアルに復元できます。

研究方法と実験結果を見てみましょう。

方法

カスケード変調 GAN

画像補完のグローバルなコンテキストをより適切にモデル化するために、この研究では、グローバルコード変調と空間コード変調をカスケード接続する新しいメカニズムを提案します。このメカニズムは、グローバルコンテキストを空間ドメインに適切に挿入しながら、部分的に無効なフィーチャを処理するのに役立ちます。新しいアーキテクチャ CM-GAN は、以下の図 1 に示すように、全体の構造と局所的な詳細を適切に合成できます。

画像の大部分が欠落している場合でも、新しいモデル CM-GAN は全体的な構造とテクスチャの詳細を考慮して、リアルに復元できます。

#下の図 2 (左) に示すように、CM-GAN は 1 つのエンコーダーブランチと 2 つの並列カスケードに基づいています。視覚的な出力を生成するためのデコーダーブランチ。エンコーダーは画像とマスクの一部を入力として受け取り、マルチスケール特徴マップ

を生成します。画像の大部分が欠落している場合でも、新しいモデル CM-GAN は全体的な構造とテクスチャの詳細を考慮して、リアルに復元できます。

ほとんどのエンコーダ/デコーダ手法とは異なり、全体の構造を完成させるために、この調査では完全に接続された層の最上位の機能

からグローバルスタイルコードを抽出します。次に画像の大部分が欠落している場合でも、新しいモデル CM-GAN は全体的な構造とテクスチャの詳細を考慮して、リアルに復元できます。正規化。さらに、MLP ベースのマッピングネットワークは、画像生成のランダム性をシミュレートするためにノイズからスタイルコード w を生成します。コード w は s と結合されてグローバルコード g = [s; w] が生成され、これは後続の復号化ステップで使用されます。画像の大部分が欠落している場合でも、新しいモデル CM-GAN は全体的な構造とテクスチャの詳細を考慮して、リアルに復元できます。

グローバル空間カスケード変調。デコード段階でグローバルなコンテキストをより適切に接続するために、この研究ではグローバルな空間カスケード変調 (CM) を提案します。図 2 (右) に示すように、復号化ステージはグローバル変調ブロック (GB) と空間変調ブロック (SB) の 2 つのブランチに基づいており、グローバル特徴 F_g とローカル特徴 F_s を並行してアップサンプリングします。

画像の大部分が欠落している場合でも、新しいモデル CM-GAN は全体的な構造とテクスチャの詳細を考慮して、リアルに復元できます。

既存の方法とは異なり、CM-GAN ではホール領域にグローバルコンテキストを注入する新しい方法が導入されています。概念レベルでは、各スケールのフィーチャ間のカスケードされたグローバルおよび空間変調で構成され、グローバルコンテキストモデリングのための 3 つの補償メカニズム (1) フィーチャアップサンプリング、2) グローバル変調、3) 空間変調が自然に統合されています。

物体認識トレーニング

トレーニング用のマスクを生成するアルゴリズムは非常に重要です。基本的に、サンプリングされたマスクは実際の使用例で描画されるマスクと同様である必要があり、マスクはオブジェクト全体や新しいオブジェクトの大部分を覆うことを避ける必要があります。マスキングスキームを単純化しすぎると、アーティファクトが発生する可能性があります。

モデルが穴内で新しいオブジェクトを合成するのを防ぎながら、実際のオブジェクトの削除のユースケースをより適切にサポートするために、この研究では、次に示すように、より現実的なマスクを生成するオブジェクト認識トレーニングスキームを提案します。下の図4。

画像の大部分が欠落している場合でも、新しいモデル CM-GAN は全体的な構造とテクスチャの詳細を考慮して、リアルに復元できます。

具体的には、この研究ではまずトレーニング画像をパノラマセグメンテーションネットワーク PanopticFCN に渡し、高精度のインスタンスレベルのアノテーションがセグメント化され、次にフリーホールとオブジェクトホールの混合が初期マスクとしてサンプリングされ、最後にホールと画像内の各インスタンスの間のオーバーラップ率が計算されます。オーバーラップ率がしきい値より大きい場合、メソッドは前景インスタンスを穴から除外します。それ以外の場合、穴は変更されず、しきい値を 0.5 に設定してシミュレートされたオブジェクトが完成します。この研究では、オブジェクトマスクをランダムに拡張および変換して、過剰適合を回避します。さらに、この調査では、穴の近くの背景ピクセルが塗りつぶされた領域に漏れることを避けるために、インスタンスのセグメンテーション境界上の穴を拡大しています。

Masked-R_1 正則化によるトレーニング目標

モデルは、敵対的損失とセグメンテーションベースの知覚損失の組み合わせを使用してトレーニングされます。実験によると、この方法は純粋に敵対的損失を使用する場合にも良好な結果を達成できますが、知覚的損失を追加するとパフォーマンスがさらに向上する可能性があります。

さらに、この研究では、安定した修復タスクの敵対的トレーニングに特化したマスク R_1 正則化も提案しています。マスク m は、マスク外の勾配ペナルティの計算を回避するために利用されます。

実験

この研究では、Places2 データセットに対して 512 × 512 の解像度で画像修復実験を実施し、モデルの定量的な結果を示しました。そして定性的な評価結果。

定量的評価: 以下の表 1 は、CM-GAN と他のマスキング手法を比較しています。結果は、CM-GAN が FID、LPIPS、U-IDS、および P-IDS の点で他の方法よりも大幅に優れていることを示しています。 LaMa の知覚損失の助けにより、CM-GAN は、事前トレーニングされた知覚モデルによって提供される追加のセマンティックガイダンスのおかげで、CoModGAN や他の方法よりも大幅に優れた LPIPS スコアを達成します。 LaMa/CoModGAN と比較して、CM-GAN は FID を 3.864/3.724 から 1.628 に削減します。

画像の大部分が欠落している場合でも、新しいモデル CM-GAN は全体的な構造とテクスチャの詳細を考慮して、リアルに復元できます。

以下の表 3 に示すように、微調整の有無にかかわらず、CM-GAN は LaMa およびCoModGAN マスクどちらも LaMa および CoModGAN よりも大幅に優れたパフォーマンス向上を達成しており、このモデルが一般化機能を備えていることを示しています。 CoModGAN マスク、オブジェクト認識マスクでトレーニングされた CM-GAN のパフォーマンスが依然として CoModGAN マスクのパフォーマンスより優れていることは注目に値します。これは、CM-GAN の生成能力が優れていることを裏付けています。

画像の大部分が欠落している場合でも、新しいモデル CM-GAN は全体的な構造とテクスチャの詳細を考慮して、リアルに復元できます。

定性的評価: 図 5、図 6、および図 8 は、合成マスクでの CM-GAN および SOTA メソッドを示しています。側面からの比較結果です。 ProFill は一貫性のないグローバル構造を生成でき、CoModGAN は構造アーチファクトやカラースポットを生成し、LaMa は自然のシーンで大きな画像のぼやけが発生する傾向があります。対照的に、CM-GAN 手法は、より一貫性のある意味構造とより鮮明なテクスチャを生成し、さまざまなシナリオに適用できます。

画像の大部分が欠落している場合でも、新しいモデル CM-GAN は全体的な構造とテクスチャの詳細を考慮して、リアルに復元できます。

#モデル内の各コンポーネントの重要性を検証するために、この研究では一連のアブレーション実験を実施し、すべてのモデルは Places2 データセットでトレーニングおよび評価されました。アブレーション実験の結果を以下の表 2 および図 7 に示します。

画像の大部分が欠落している場合でも、新しいモデル CM-GAN は全体的な構造とテクスチャの詳細を考慮して、リアルに復元できます。

#調査では、より適切に評価するために、ユーザー調査も実施しました。 CM-GAN 法の視覚生成品質の結果を以下の表 5 に示します。さらに、付録では、読者の参考のために、より多くの視覚的な比較と実験的分析を提供します。

画像の大部分が欠落している場合でも、新しいモデル CM-GAN は全体的な構造とテクスチャの詳細を考慮して、リアルに復元できます。 ##

以上が画像の大部分が欠落している場合でも、新しいモデル CM-GAN は全体的な構造とテクスチャの詳細を考慮して、リアルに復元できます。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

神レベルのコード編集ソフト（SublimeText3）

ホットトピック

Gmailメールのログイン入り口はどこですか？

7447

CakePHP チュートリアル

1374

Steamのアカウント名の形式は何ですか

Win11 Activation Key Permanent

NYTの接続はヒントと回答です

Related knowledge

この Apple ID は iTunes Store でまだ使用されていません: 修正 Jun 10, 2024 pm 05:42 PM

AppleIDを使用してiTunesStoreにログインすると、「このAppleIDはiTunesStoreで使用されていません」というエラーが画面に表示される場合があります。心配するようなエラーメッセージはありません。これらのソリューションセットに従って問題を修正できます。解決策 1 – 配送先住所を変更する iTunes Store にこのプロンプトが表示される主な理由は、AppleID プロファイルに正しい住所がないことです。ステップ 1 – まず、iPhone で iPhone 設定を開きます。ステップ 2 – AppleID は他のすべての設定の最上位にある必要があります。それで、開けてください。ステップ 3 – そこに到達したら、「支払いと配送」オプションを開きます。ステップ 4 – Face ID を使用してアクセスを確認します。ステップ

iPhoneの赤目を修正する方法 Feb 23, 2024 pm 04:31 PM

前回のパーティーでは素晴らしい写真をいくつか撮ったのですが、残念ながら、撮った写真のほとんどが赤目でした。写真自体は素晴らしいのですが、赤い目が写っているとイメージが台無しになってしまいます。言うまでもなく、パーティーの写真の中には友達の携帯電話からのものもあるかもしれません。今回は写真から赤目を除去する方法を見てみましょう。写真の目が赤い原因は何ですか?フラッシュを使用して写真を撮影すると、赤目が発生することがよくあります。これは、フラッシュの光が目の奥に直接当たるため、目の下の血管が光を反射し、目が赤く写ってしまうためです。幸いなことに、技術の継続的な進歩により、一部のカメラにはこの問題を効果的に解決できる赤目補正機能が搭載されています。この機能を使用すると、カメラは写真を撮影します

Win11 が資格情報の検証に失敗する問題を解決するにはどうすればよいですか? Jan 30, 2024 pm 02:03 PM

Win11 ユーザーが資格情報を使用してログインすると、資格情報を検証できないことを示すエラーメッセージが表示されます。何が起こっているのでしょうか?編集者がこの問題を調査した結果、この問題を直接的または間接的に引き起こすいくつかの状況が考えられることがわかりました。編集者と一緒に見てみましょう。

Windows 11 のブルースクリーンの問題を解決するための簡単なガイド Dec 27, 2023 pm 02:26 PM

多くの友人は、コンピューターのオペレーティングシステムを使用するときに常にブルースクリーンに遭遇します。最新の win11 システムでもブルースクリーンの運命から逃れることはできません。そこで、今日は win11 のブルースクリーンを修復する方法についてのチュートリアルをお届けしました。ブルースクリーンに遭遇したかどうかに関係なく、必要な場合に備えて最初にそれを学ぶことができます。 win11 ブルースクリーンを修正する方法方法 1. ブルースクリーンが発生した場合は、まずシステムを再起動し、正常に起動できるかどうかを確認します。 2. 正常に起動できる場合は、デスクトップ上の「コンピュータ」を右クリックし、「管理」を選択します。 3. 次に、ポップアップウィンドウの左側にある「システムツール」を展開し、「イベントビューア」を選択します。イベントビューアを使用すると、ブルースクリーンの原因となった特定の問題がわかります。 5. 次に、ブルースクリーンの状況とイベントに従ってください。

PHP 500 エラーの総合ガイド: 原因、診断、修正 Mar 22, 2024 pm 12:45 PM

PHP 500 エラーの包括的なガイド: 原因、診断、および修正 PHP 開発中に、HTTP ステータスコード 500 のエラーが頻繁に発生します。このエラーは通常「500InternalServerError」と呼ばれ、サーバー側でのリクエストの処理中に不明なエラーが発生したことを意味します。この記事では、PHP500 エラーの一般的な原因、診断方法、修正方法を検討し、参照用の具体的なコード例を示します。 1.500 エラーの一般的な原因 1.

WIN10で音量調整ができない時の対処法 Mar 27, 2024 pm 05:16 PM

1. win + r キーを押してファイル名を指定して実行ウィンドウを開き、「regedit」と入力して Enter キーを押してレジストリエディターを開きます。 2. 開いたレジストリエディタで[HKEY_LOCAL_MACHINESOFTWAREMicrosoftWindowsCurrentVersionRun]をクリックして展開し、右側の空白部分を右クリックして[新規 - 文字列値]を選択し、名前を[systray.exe]に変更します。 3. systray.exeをダブルクリックして開き、数値データを「C:WindowsSystem32systray.exe」に変更し、[OK]をクリックして設定を保存します。

csrss.exe が原因で発生するブルースクリーンの問題を解決する方法 Dec 28, 2023 pm 06:24 PM

コンピュータの起動後に頻繁にブルースクリーンが表示される場合は、Windows システムによって csrss.exe ファイルに対して発生する重大なエラー (停止コード 0xF4) が原因である可能性があります。では、それを修正する方法を見てみましょう! csrss.exe のブルースクリーンを修正する方法まず、「Ctrl+Alt+Del」キーを同時に押します。このとき、Microsoft Windows タスクマネージャーのインターフェイスがポップアップ表示されます。「タスクマネージャー」タブをクリックすると、実行中のすべてのプログラムとそれらが占有するリソース、その他の情報が画面に一覧表示されます。もう一度クリックして「プロセス」タブに入り、「イメージ名」をもう一度クリックして、リストで「csrss.exe」ファイルを見つけます。「プロセスの終了」ボタンをクリックします

ネットワークカードドライバーの異常によりインターネットにアクセスできない問題を解決する方法 Jan 06, 2024 pm 06:33 PM

友人の中には、異常なネットワークカードドライバーが原因でコンピューターがインターネットにアクセスできないことに気づき、その修復方法を知りたがっている人もいます。実際、現在のシステムにはドライバー修復機能が組み込まれているため、手動でドライバーを更新するだけで十分です。動作しない場合でも、ドライバーソフトウェアを使用できます。ネットワークカードドライバーが異常でインターネットに接続できない問題の解決方法: PS: この問題が突然発生した場合は、まずコンピューターを再起動してみてください。再起動しても問題が解決しない場合は、次の操作を続けてください。。方法 1: 1. まず、タスクバーを右クリックし、「スタートメニュー」を選択します。 2. 右クリックメニューで「デバイスマネージャー」を開きます。 3. 「ネットワークアダプター」をクリックし、「ドライバーの更新」を選択し、「ドライバーを自動的に検索する」をクリックします。更新が完了すると、正常にインターネットにアクセスできるようになります。

See all articles

画像の大部分が欠落している場合でも、新しいモデル CM-GAN は全体的な構造とテクスチャの詳細を考慮して、リアルに復元できます。

実験

ホットAIツール

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

人気の記事

ホットツール

メモ帳++7.3.1

SublimeText3 中国語版

ゼンドスタジオ 13.0.1

ドリームウィーバー CS6

SublimeText3 Mac版

ホットトピック