目次
実験
ホームページ テクノロジー周辺機器 AI 画像の大部分が欠落している場合でも、新しいモデル CM-GAN は全体的な構造とテクスチャの詳細を考慮して、リアルに復元できます。

画像の大部分が欠落している場合でも、新しいモデル CM-GAN は全体的な構造とテクスチャの詳細を考慮して、リアルに復元できます。

Apr 08, 2023 pm 05:41 PM
画像 ネットワークの生成 修理

画像の復元とは、画像の欠落した領域を補完することを指します。これは、コンピューター ビジョンの基本的なタスクの 1 つです。この方向には、オブジェクトの削除、画像のリターゲティング、画像の合成など、多くの実用的な用途があります。

初期の修復方法は、画像の欠落部分を埋めるための画像ブロック合成または色の拡散に基づいていました。より複雑な画像構造を実現するために、研究者はデータ駆動型のアプローチに目を向けており、深い生成ネットワークを利用してビジュアルコンテンツと外観を予測しています。生成修復モデルは、大規模な画像セットでトレーニングし、再構築と敵対的損失を利用することで、自然画像や人間の顔などのさまざまな種類の入力データに対して、より視覚的に魅力的な結果を生成することが示されています。

しかし、既存の作品は単純な画像構造を完成させる場合にのみ良好な結果を示すことができ、複雑な全体構造と高いディテール忠実度を備えた画像コンテンツを生成することは依然として大きな課題です。穴が大きい。

本質的に、画像修復は 2 つの重要な問題に直面しています: 1 つはグローバル コンテキストを不完全な領域に正確に伝播する方法であり、もう 1 つはグローバル キューと一致する実際のローカル パーツを合成することです。 。グローバルなコンテキスト伝播の問題を解決するために、既存のネットワークは、エンコーダ - デコーダ構造、アトラス畳み込み、コンテキスト アテンション、またはフーリエ畳み込みを利用して、長距離の特徴依存関係を統合し、有効な受容野を拡張します。さらに、2 段階のアプローチと反復的な穴埋めは、大まかな結果の予測に依存して全体的な構造を強化します。ただし、これらのモデルには、マスクされていない領域の高レベルのセマンティクスを取得し、それらを効果的にホールに伝播して全体的なグローバル構造を合成するメカニズムが欠けています。

これに基づいて、ロチェスター大学と Adob​​e Research の研究者は、新世代ネットワーク CM-GAN (カスケード変調 GAN) を提案しました。これは、全体の構造を地理的により適切に合成し、地元の詳細。 CM-GAN には、穴のある入力画像からマルチスケールの特徴表現を抽出するためのフーリエ畳み込みブロックを備えたエンコーダーが含まれています。 CM-GAN には 2 ストリーム デコーダもあり、各スケール レイヤーに新しいカスケード グローバル空間変調ブロックを設定します。

各デコーダ ブロックでは、まずグローバル変調を適用して粗く意味を意識した構造合成を実行し、次に空間変調を実行して空間適応的な方法で特徴マップをさらに調整します。さらに、この研究では、現実のシーンでの物体除去タスクのニーズを満たすために、空洞内のアーティファクトを防ぐための物体知覚トレーニングスキームを設計しました。この研究では広範な実験が行われ、CM-GAN が定量的評価と定性的評価の両方で既存の方法よりも大幅に優れていることが示されました。

画像の大部分が欠落している場合でも、新しいモデル CM-GAN は全体的な構造とテクスチャの詳細を考慮して、リアルに復元できます。

    #論文アドレス: https://arxiv.org/pdf/2203.11947.pdf
  • プロジェクトアドレス: https://github.com/htzheng/CM-GAN-Inpainting

まずは画像修復効果を見てみましょう。他の方法と比較して、CM -GAN はより優れたテクスチャを再構築できます:

画像の大部分が欠落している場合でも、新しいモデル CM-GAN は全体的な構造とテクスチャの詳細を考慮して、リアルに復元できます。

##CM-GAN はより優れたグローバル構造を合成できます:

画像の大部分が欠落している場合でも、新しいモデル CM-GAN は全体的な構造とテクスチャの詳細を考慮して、リアルに復元できます。

##CM-GAN はより優れたオブジェクト境界を備えています:

画像の大部分が欠落している場合でも、新しいモデル CM-GAN は全体的な構造とテクスチャの詳細を考慮して、リアルに復元できます。

研究方法と実験結果を見てみましょう。

方法

カスケード変調 GAN

画像補完のグローバルなコンテキストをより適切にモデル化するために、この研究では、グローバル コード変調と空間コード変調をカスケード接続する新しいメカニズムを提案します。このメカニズムは、グローバル コンテキストを空間ドメインに適切に挿入しながら、部分的に無効なフィーチャを処理するのに役立ちます。新しいアーキテクチャ CM-GAN は、以下の図 1 に示すように、全体の構造と局所的な詳細を適切に合成できます。

画像の大部分が欠落している場合でも、新しいモデル CM-GAN は全体的な構造とテクスチャの詳細を考慮して、リアルに復元できます。

#下の図 2 (左) に示すように、CM-GAN は 1 つのエンコーダー ブランチと 2 つの並列カスケードに基づいています。視覚的な出力を生成するためのデコーダー ブランチ。エンコーダーは画像とマスクの一部を入力として受け取り、マルチスケール特徴マップ

を生成します。 画像の大部分が欠落している場合でも、新しいモデル CM-GAN は全体的な構造とテクスチャの詳細を考慮して、リアルに復元できます。

ほとんどのエンコーダ/デコーダ手法とは異なり、全体の構造を完成させるために、この調査では完全に接続された層の最上位の機能

からグローバル スタイル コードを抽出します。次に 画像の大部分が欠落している場合でも、新しいモデル CM-GAN は全体的な構造とテクスチャの詳細を考慮して、リアルに復元できます。正規化。さらに、MLP ベースのマッピング ネットワークは、画像生成のランダム性をシミュレートするためにノイズからスタイル コード w を生成します。コード w は s と結合されてグローバル コード g = [s; w] が生成され、これは後続の復号化ステップで使用されます。 画像の大部分が欠落している場合でも、新しいモデル CM-GAN は全体的な構造とテクスチャの詳細を考慮して、リアルに復元できます。

グローバル空間カスケード変調。デコード段階でグローバルなコンテキストをより適切に接続するために、この研究ではグローバルな空間カスケード変調 (CM) を提案します。図 2 (右) に示すように、復号化ステージはグローバル変調ブロック (GB) と空間変調ブロック (SB) の 2 つのブランチに基づいており、グローバル特徴 F_g とローカル特徴 F_s を並行してアップサンプリングします。

画像の大部分が欠落している場合でも、新しいモデル CM-GAN は全体的な構造とテクスチャの詳細を考慮して、リアルに復元できます。

既存の方法とは異なり、CM-GAN ではホール領域にグローバル コンテキストを注入する新しい方法が導入されています。概念レベルでは、各スケールのフィーチャ間のカスケードされたグローバルおよび空間変調で構成され、グローバル コンテキスト モデリングのための 3 つの補償メカニズム (1) フィーチャ アップサンプリング、2) グローバル変調、3) 空間変調が自然に統合されています。

物体認識トレーニング

トレーニング用のマスクを生成するアルゴリズムは非常に重要です。基本的に、サンプリングされたマスクは実際の使用例で描画されるマスクと同様である必要があり、マスクはオブジェクト全体や新しいオブジェクトの大部分を覆うことを避ける必要があります。マスキング スキームを単純化しすぎると、アーティファクトが発生する可能性があります。

モデルが穴内で新しいオブジェクトを合成するのを防ぎながら、実際のオブジェクトの削除のユースケースをより適切にサポートするために、この研究では、次に示すように、より現実的なマスクを生成するオブジェクト認識トレーニング スキームを提案します。下の図4。

画像の大部分が欠落している場合でも、新しいモデル CM-GAN は全体的な構造とテクスチャの詳細を考慮して、リアルに復元できます。

具体的には、この研究ではまずトレーニング画像をパノラマ セグメンテーション ネットワーク PanopticFCN に渡し、高精度のインスタンス レベルのアノテーションがセグメント化され、次にフリー ホールとオブジェクト ホールの混合が初期マスクとしてサンプリングされ、最後にホールと画像内の各インスタンスの間のオーバーラップ率が計算されます。オーバーラップ率がしきい値より大きい場合、メソッドは前景インスタンスを穴から除外します。それ以外の場合、穴は変更されず、しきい値を 0.5 に設定してシミュレートされたオブジェクトが完成します。この研究では、オブジェクト マスクをランダムに拡張および変換して、過剰適合を回避します。さらに、この調査では、穴の近くの背景ピクセルが塗りつぶされた領域に漏れることを避けるために、インスタンスのセグメンテーション境界上の穴を拡大しています。

Masked-R_1 正則化によるトレーニング目標

モデルは、敵対的損失とセグメンテーション ベースの知覚損失の組み合わせを使用してトレーニングされます。実験によると、この方法は純粋に敵対的損失を使用する場合にも良好な結果を達成できますが、知覚的損失を追加するとパフォーマンスがさらに向上する可能性があります。

さらに、この研究では、安定した修復タスクの敵対的トレーニングに特化したマスク R_1 正則化も提案しています。マスク m は、マスク外の勾配ペナルティの計算を回避するために利用されます。

実験

この研究では、Places2 データセットに対して 512 × 512 の解像度で画像修復実験を実施し、モデルの定量的な結果を示しました。そして定性的な評価結果。

定量的評価: 以下の表 1 は、CM-GAN と他のマスキング手法を比較しています。結果は、CM-GAN が FID、LPIPS、U-IDS、および P-IDS の点で他の方法よりも大幅に優れていることを示しています。 LaMa の知覚損失の助けにより、CM-GAN は、事前トレーニングされた知覚モデルによって提供される追加のセマンティック ガイダンスのおかげで、CoModGAN や他の方法よりも大幅に優れた LPIPS スコアを達成します。 LaMa/CoModGAN と比較して、CM-GAN は FID を 3.864/3.724 から 1.628 に削減します。

画像の大部分が欠落している場合でも、新しいモデル CM-GAN は全体的な構造とテクスチャの詳細を考慮して、リアルに復元できます。

以下の表 3 に示すように、微調整の有無にかかわらず、CM-GAN は LaMa およびCoModGAN マスク どちらも LaMa および CoModGAN よりも大幅に優れたパフォーマンス向上を達成しており、このモデルが一般化機能を備えていることを示しています。 CoModGAN マスク、オブジェクト認識マスクでトレーニングされた CM-GAN のパフォーマンスが依然として CoModGAN マスクのパフォーマンスより優れていることは注目に値します。これは、CM-GAN の生成能力が優れていることを裏付けています。

画像の大部分が欠落している場合でも、新しいモデル CM-GAN は全体的な構造とテクスチャの詳細を考慮して、リアルに復元できます。

定性的評価: 図 5、図 6、および図 8 は、合成マスクでの CM-GAN および SOTA メソッドを示しています。側面からの比較結果です。 ProFill は一貫性のないグローバル構造を生成でき、CoModGAN は構造アーチファクトやカラースポットを生成し、LaMa は自然のシーンで大きな画像のぼやけが発生する傾向があります。対照的に、CM-GAN 手法は、より一貫性のある意味構造とより鮮明なテクスチャを生成し、さまざまなシナリオに適用できます。

画像の大部分が欠落している場合でも、新しいモデル CM-GAN は全体的な構造とテクスチャの詳細を考慮して、リアルに復元できます。

画像の大部分が欠落している場合でも、新しいモデル CM-GAN は全体的な構造とテクスチャの詳細を考慮して、リアルに復元できます。

画像の大部分が欠落している場合でも、新しいモデル CM-GAN は全体的な構造とテクスチャの詳細を考慮して、リアルに復元できます。

#モデル内の各コンポーネントの重要性を検証するために、この研究では一連のアブレーション実験を実施し、すべてのモデルは Places2 データセットでトレーニングおよび評価されました。アブレーション実験の結果を以下の表 2 および図 7 に示します。

画像の大部分が欠落している場合でも、新しいモデル CM-GAN は全体的な構造とテクスチャの詳細を考慮して、リアルに復元できます。

画像の大部分が欠落している場合でも、新しいモデル CM-GAN は全体的な構造とテクスチャの詳細を考慮して、リアルに復元できます。

#調査では、より適切に評価するために、ユーザー調査も実施しました。 CM-GAN 法の視覚生成品質の結果を以下の表 5 に示します。さらに、付録では、読者の参考のために、より多くの視覚的な比較と実験的分析を提供します。

画像の大部分が欠落している場合でも、新しいモデル CM-GAN は全体的な構造とテクスチャの詳細を考慮して、リアルに復元できます。 ##

以上が画像の大部分が欠落している場合でも、新しいモデル CM-GAN は全体的な構造とテクスチャの詳細を考慮して、リアルに復元できます。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

この Apple ID は iTunes Store でまだ使用されていません: 修正 この Apple ID は iTunes Store でまだ使用されていません: 修正 Jun 10, 2024 pm 05:42 PM

AppleIDを使用してiTunesStoreにログインすると、「このAppleIDはiTunesStoreで使用されていません」というエラーが画面に表示される場合があります。心配するようなエラー メッセージはありません。これらのソリューション セットに従って問題を修正できます。解決策 1 – 配送先住所を変更する iTunes Store にこのプロンプトが表示される主な理由は、AppleID プロファイルに正しい住所がないことです。ステップ 1 – まず、iPhone で iPhone 設定を開きます。ステップ 2 – AppleID は他のすべての設定の最上位にある必要があります。それで、開けてください。ステップ 3 – そこに到達したら、「支払いと配送」オプションを開きます。ステップ 4 – Face ID を使用してアクセスを確認します。ステップ

iPhoneの赤目を修正する方法 iPhoneの赤目を修正する方法 Feb 23, 2024 pm 04:31 PM

前回のパーティーでは素晴らしい写真をいくつか撮ったのですが、残念ながら、撮った写真のほとんどが赤目でした。写真自体は素晴らしいのですが、赤い目が写っているとイメージが台無しになってしまいます。言うまでもなく、パーティーの写真の中には友達の携帯電話からのものもあるかもしれません。今回は写真から赤目を除去する方法を見てみましょう。写真の目が赤い原因は何ですか?フラッシュを使用して写真を撮影すると、赤目が発生することがよくあります。これは、フラッシュの光が目の奥に直接当たるため、目の下の血管が光を反射し、目が赤く写ってしまうためです。幸いなことに、技術の継続的な進歩により、一部のカメラにはこの問題を効果的に解決できる赤目補正機能が搭載されています。この機能を使用すると、カメラは写真を撮影します

Win11 が資格情報の検証に失敗する問題を解決するにはどうすればよいですか? Win11 が資格情報の検証に失敗する問題を解決するにはどうすればよいですか? Jan 30, 2024 pm 02:03 PM

Win11 ユーザーが資格情報を使用してログインすると、資格情報を検証できないことを示すエラー メッセージが表示されます。何が起こっているのでしょうか?編集者がこの問題を調査した結果、この問題を直接的または間接的に引き起こすいくつかの状況が考えられることがわかりました。編集者と一緒に見てみましょう。

Windows 11 のブルー スクリーンの問題を解決するための簡単なガイド Windows 11 のブルー スクリーンの問題を解決するための簡単なガイド Dec 27, 2023 pm 02:26 PM

多くの友人は、コンピューターのオペレーティング システムを使用するときに常にブルー スクリーンに遭遇します。最新の win11 システムでもブルー スクリーンの運命から逃れることはできません。そこで、今日は win11 のブルー スクリーンを修復する方法についてのチュートリアルをお届けしました。ブルー スクリーンに遭遇したかどうかに関係なく、必要な場合に備えて最初にそれを学ぶことができます。 win11 ブルースクリーンを修正する方法 方法 1. ブルースクリーンが発生した場合は、まずシステムを再起動し、正常に起動できるかどうかを確認します。 2. 正常に起動できる場合は、デスクトップ上の「コンピュータ」を右クリックし、「管理」を選択します。 3. 次に、ポップアップウィンドウの左側にある「システムツール」を展開し、「イベントビューア」を選択します。イベント ビューアを使用すると、ブルー スクリーンの原因となった特定の問題がわかります。 5. 次に、ブルー スクリーンの状況とイベントに従ってください。

PHP 500 エラーの総合ガイド: 原因、診断、修正 PHP 500 エラーの総合ガイド: 原因、診断、修正 Mar 22, 2024 pm 12:45 PM

PHP 500 エラーの包括的なガイド: 原因、診断、および修正 PHP 開発中に、HTTP ステータス コード 500 のエラーが頻繁に発生します。このエラーは通常「500InternalServerError」と呼ばれ、サーバー側でのリクエストの処理中に不明なエラーが発生したことを意味します。この記事では、PHP500 エラーの一般的な原因、診断方法、修正方法を検討し、参照用の具体的なコード例を示します。 1.500 エラーの一般的な原因 1.

WIN10で音量調整ができない時の対処法 WIN10で音量調整ができない時の対処法 Mar 27, 2024 pm 05:16 PM

1. win + r キーを押してファイル名を指定して実行ウィンドウを開き、「regedit」と入力して Enter キーを押してレジストリ エディターを開きます。 2. 開いたレジストリエディタで[HKEY_LOCAL_MACHINESOFTWAREMicrosoftWindowsCurrentVersionRun]をクリックして展開し、右側の空白部分を右クリックして[新規 - 文字列値]を選択し、名前を[systray.exe]に変更します。 3. systray.exeをダブルクリックして開き、数値データを「C:WindowsSystem32systray.exe」に変更し、[OK]をクリックして設定を保存します。

Windows 11/10のaksfridge.sysブルースクリーンエラーを修正 Windows 11/10のaksfridge.sysブルースクリーンエラーを修正 Feb 11, 2024 am 11:30 AM

Windows 11 または Windows 10 にアップグレードした後に aksfridge.sys ブルー スクリーン エラーが発生した場合、この記事では解決策を提供します。この問題を正常に解決するには、次の方法を試してください。本物の aksfridge.sys ファイルは、AladdinKnowledgeSystems の AladdinHASP のソフトウェア コンポーネントです。 AladdinHASP (Hardware Anti-Software Piracy) は、デジタル著作権管理 (DRM) 保護およびライセンス ソフトウェアのスイートです。 Aksfridge.sys は、HASP が適切に機能するために必要なフィルター ドライバーです。このコンポーネントは、特殊な外部デバイスのサポートを追加します。ハードウェア アンチソフトウェア 著作権侵害 (AladdinHAS とも呼ばれます)

csrss.exe が原因で発生するブルー スクリーンの問題を解決する方法 csrss.exe が原因で発生するブルー スクリーンの問題を解決する方法 Dec 28, 2023 pm 06:24 PM

コンピュータの起動後に頻繁にブルー スクリーンが表示される場合は、Windows システムによって csrss.exe ファイルに対して発生する重大なエラー (停止コード 0xF4) が原因である可能性があります。では、それを修正する方法を見てみましょう! csrss.exe のブルー スクリーンを修正する方法 まず、「Ctrl+Alt+Del」キーを同時に押します。このとき、Microsoft Windows タスク マネージャーのインターフェイスがポップアップ表示されます。 「タスクマネージャー」タブをクリックすると、実行中のすべてのプログラムとそれらが占有するリソース、その他の情報が画面に一覧表示されます。もう一度クリックして「プロセス」タブに入り、「イメージ名」をもう一度クリックして、リストで「csrss.exe」ファイルを見つけます。 「プロセスの終了」ボタンをクリックします

See all articles