目次
解釈可能な GAN の学習は、次の 2 つの目標を満たさなければなりません:
この研究では、視覚的な概念に手動で注釈を付けることなく、従来の GAN を解釈可能な GAN に変更できる一般的な方法を提案します。解釈可能な GAN では、ジェネレーターの中間層の各コンボリューション カーネルは、異なる画像を生成するときに同じ視覚的コンセプトを安定して生成できます。
ホームページ テクノロジー周辺機器 AI 従来の GAN は変更後に解釈することができ、コンボリューション カーネルの解釈可能性と生成された画像の信頼性を保証します。

従来の GAN は変更後に解釈することができ、コンボリューション カーネルの解釈可能性と生成された画像の信頼性を保証します。

Apr 08, 2023 pm 02:21 PM
ai 画像 gan

従来の GAN は変更後に解釈することができ、コンボリューション カーネルの解釈可能性と生成された画像の信頼性を保証します。

  • #論文アドレス: https://www.aaai.org/AAAI22Papers/AAAI-7931.LiC.pdf
  • ##著者単位: 計算技術研究所、中国科学院、上海交通大学、志江研究所
研究背景と研究課題

Generative Adversarialネットワーク (GAN) は高解像度画像の生成に大きな成功を収めており、その解釈可能性に関する研究も近年広く注目を集めています。

この分野では、GAN に分離表現を学習させる方法が依然として大きな課題です。 GAN のいわゆる分離表現は、表現の各部分が生成された画像の特定の側面にのみ影響を与えることを意味します。 GAN の分離表現に関するこれまでの研究は、さまざまな観点に焦点を当てていました。

たとえば、以下の図 1 では、方法 1 は画像の構造とスタイルを分離しています。方法 2 では、画像内のローカル オブジェクトの特徴を学習します。方法 3 では、顔画像の年齢属性や性別属性など、画像内の属性の分離された特徴を学習します。しかし、これらの研究では、さまざまな視覚概念 (目、鼻、口などの顔の部分など) を GAN で明確かつ象徴的に表現することができませんでした。

従来の GAN は変更後に解釈することができ、コンボリューション カーネルの解釈可能性と生成された画像の信頼性を保証します。

#図 1: 他の GAN 分離表現方法との視覚的比較

この目的のために、研究者は従来の GAN を解釈可能な GAN

に変更するための 一般的な方法を提案しました。ジェネレーターの中間層は、分離されたローカルの視覚概念を学習できます。具体的には、以下の図 2 に示すように、従来の GAN と比較して、解釈可能な GAN の中間層の各コンボリューション カーネルは、異なる画像を生成するときに常に特定の視覚的概念を表し、異なるコンボリューション カーネルは異なるビジョンを表します。

従来の GAN は変更後に解釈することができ、コンボリューション カーネルの解釈可能性と生成された画像の信頼性を保証します。

図 2: 解釈可能な GAN と従来の GAN エンコーディング表現の視覚的比較 モデリング手法

解釈可能な GAN の学習は、次の 2 つの目標を満たさなければなりません:

畳み込みカーネルの解釈可能性および 生成された画像の信頼性

畳み込みカーネルの解釈可能性: 研究者は、中間層の畳み込みカーネルが視覚的概念に手動で注釈を付けることなく、意味のある視覚的概念を自動的に学習できることを望んでいます。具体的には、各コンボリューションカーネルは、異なる画像を生成するときに、同じ視覚概念に対応する画像領域を安定して生成する必要があります。異なる畳み込みカーネルは、異なる視覚概念に対応する画像領域を生成する必要があります;
  • 生成された画像の信頼性: 解釈可能な GAN ジェネレーターは依然として現実的な画像を生成できます。
  • ターゲット層でのコンボリューション カーネルの解釈可能性を確保するために、研究者らは、複数のコンボリューション カーネルが特定の視覚的概念に対応する同様の領域を生成する場合、このビジュアルコンセプトを共同で表現します。

したがって、コンボリューション カーネルのセットを使用して特定の視覚的概念を共同で表現し、異なるコンボリューション カーネルのセットを使用してそれぞれ異なる視覚的概念を表現します。

生成された画像の信頼性を同時に保証するために、研究者らは、従来の GAN を解釈可能な GAN に変更するために次の損失関数を設計しました。

  • #従来の GAN の損失 #: この損失は、生成されたイメージの信頼性を保証するために使用されます。
  • 畳み込みカーネルの除算損失: ジェネレーターが与えられた場合、この損失は、同じグループ内の畳み込みカーネルが生成するように畳み込みカーネルを分割する方法を見つけるために使用されます。同様の画像領域。具体的には、混合ガウス モデル (GMM) を使用して、各グループの畳み込みカーネルの特徴マップが同様の神経活性化を持つことを保証するために畳み込みカーネルがどのように分割されるかを学習します。 ##エネルギー モデルの信頼性の損失: ターゲット層カーネルがどのように分割されているかを考慮すると、同じグループ内の各カーネルに同じ視覚的コンセプトを生成させると、生成される画像の品質が低下する可能性があります。生成された画像の信頼性をさらに保証するために、エネルギー モデルを使用してターゲット レイヤーの特徴マップの信頼性確率を出力し、最尤推定を使用してエネルギー モデルのパラメーターを学習します。
  • ##コンボリューション カーネルの解釈可能性の損失: ターゲット層のコンボリューション カーネル分割方法を考慮すると、この損失は、コンボリューション カーネルの解釈可能性をさらに向上させるために使用されます。具体的には、この損失により、同じグループ内の各コンボリューション カーネルは同じ画像領域を一意に生成しますが、異なるグループのコンボリューション カーネルは異なる画像領域を生成します。
  • 実験結果
  • 実験では、研究者らは解釈可能な GAN を定性的および定量的に評価しました。
定性分析では、各コンボリューション カーネルの特徴マップを視覚化し、さまざまな画像に対するコンボリューション カーネルのパフォーマンスを評価しました。表現されたビジュアルコンセプト。以下の図 3 に示すように、解釈可能な GAN では、各コンボリューション カーネルは、異なる画像を生成するときに常に同じ視覚概念に対応する画像領域を生成しますが、異なる畳み込みカーネルは、異なる視覚概念に対応する画像領域を生成します。

#図 3: 解釈可能な GAN での機能マップの視覚化

実験では、以下の図 4(a) に示すように、コンボリューション カーネルの各グループのグループ中心とコンボリューション カーネル間の受容野の差も比較されました。図 4(b) は、解釈可能な GAN におけるさまざまな視覚概念に対応するコンボリューション カーネルの数の割合を示しています。図 4(c) は、分割するために選択されたコンボリューション カーネル グループの数が異なる場合、グループが増えるほど、解釈可能な GAN によって学習される視覚的概念がより詳細になることを示しています。 従来の GAN は変更後に解釈することができ、コンボリューション カーネルの解釈可能性と生成された画像の信頼性を保証します。

#図 4: 解釈可能な GAN の定性的評価

##解釈可能な GAN

は、生成された画像上の特定の視覚概念の変更もサポートします従来の GAN は変更後に解釈することができ、コンボリューション カーネルの解釈可能性と生成された画像の信頼性を保証します。

。たとえば、画像間の特定の視覚概念の相互作用は、解釈可能なレイヤーで対応する特徴マップを交換することによって実現できます。つまり、ローカル/グローバルの顔の交換が完了します。

下の図 5 は、画像のペア間で口、髪、鼻を交換した結果を示しています。最後の列は、変更されたイメージと元のイメージの違いを示します。この結果は、研究者の方法が、他の無関係な領域を変更せずに、局所的な視覚概念のみを変更したことを示しています。

#図 5: 特定の視覚的概念を交換して画像を生成する

さらに、以下の図 6 は、顔全体を交換する場合の

メソッドの効果も示しています。 従来の GAN は変更後に解釈することができ、コンボリューション カーネルの解釈可能性と生成された画像の信頼性を保証します。

図 6: 生成された画像の顔全体を交換する

定量分析について、研究者らは顔検証実験を使用して、顔交換結果の精度を評価しました。具体的には、顔画像のペアが与えられると、元の画像の顔がソース画像の顔に置き換えられて、変更された画像が生成されます。次に、変更された画像の顔とソース画像の顔が同じアイデンティティを持つかどうかをテストします。

以下の表 1 は、さまざまな方法による顔認証結果の精度を示しています##。アイデンティティの保持の点で、他の顔交換方法よりも優れています。

従来の GAN は変更後に解釈することができ、コンボリューション カーネルの解釈可能性と生成された画像の信頼性を保証します。

#表 1: 顔交換識別の精度評価

さらに、特定の視覚概念を変更する方法の局所性も実験で評価されます。具体的には、研究者らは、RGB 空間における元の画像と変更後の画像の間の平均二乗誤差 (MSE) を計算し、特定の視覚概念の領域外 MSE と領域内 MSE の比を実験として使用しました。地域性評価の指標です。

結果は以下の表 2 に示されています。研究者の修正方法は局所性が優れています、つまり領域です。修正されたビジュアルコンセプト以外の画像の変更は少なくなりました。

従来の GAN は変更後に解釈することができ、コンボリューション カーネルの解釈可能性と生成された画像の信頼性を保証します。

#表 2: 変更されたビジュアル コンセプトの局所性評価 #その他の実験結果については、論文を参照してください。

概要

この研究では、視覚的な概念に手動で注釈を付けることなく、従来の GAN を解釈可能な GAN に変更できる一般的な方法を提案します。解釈可能な GAN では、ジェネレーターの中間層の各コンボリューション カーネルは、異なる画像を生成するときに同じ視覚的コンセプトを安定して生成できます。

実験では、解釈可能な GAN を使用すると、生成された画像の特定の視覚的概念を変更することもできることが示され、GAN で生成された画像の制御可能な編集方法に新しい視点が提供されます。

以上が従来の GAN は変更後に解釈することができ、コンボリューション カーネルの解釈可能性と生成された画像の信頼性を保証します。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

Laravelの地理空間:インタラクティブマップと大量のデータの最適化 Laravelの地理空間:インタラクティブマップと大量のデータの最適化 Apr 08, 2025 pm 12:24 PM

700万のレコードを効率的に処理し、地理空間技術を使用したインタラクティブマップを作成します。この記事では、LaravelとMySQLを使用して700万を超えるレコードを効率的に処理し、それらをインタラクティブなマップの視覚化に変換する方法について説明します。最初の課題プロジェクトの要件:MySQLデータベースに700万のレコードを使用して貴重な洞察を抽出します。多くの人は最初に言語をプログラミングすることを検討しますが、データベース自体を無視します。ニーズを満たすことができますか?データ移行または構造調​​整は必要ですか? MySQLはこのような大きなデータ負荷に耐えることができますか?予備分析:キーフィルターとプロパティを特定する必要があります。分析後、ソリューションに関連している属性はわずかであることがわかりました。フィルターの実現可能性を確認し、検索を最適化するためにいくつかの制限を設定しました。都市に基づくマップ検索

Vue Axiosのタイムアウトを設定する方法 Vue Axiosのタイムアウトを設定する方法 Apr 07, 2025 pm 10:03 PM

Vue axiosのタイムアウトを設定するために、Axiosインスタンスを作成してタイムアウトオプションを指定できます。グローバル設定:Vue.Prototype。$ axios = axios.create({Timeout:5000});単一のリクエストで:this。$ axios.get( '/api/users'、{timeout:10000})。

MySQLを解決する方法は開始できません MySQLを解決する方法は開始できません Apr 08, 2025 pm 02:21 PM

MySQLの起動が失敗する理由はたくさんあり、エラーログをチェックすることで診断できます。一般的な原因には、ポートの競合(ポート占有率をチェックして構成の変更)、許可の問題(ユーザー許可を実行するサービスを確認)、構成ファイルエラー(パラメーター設定のチェック)、データディレクトリの破損(テーブルスペースの復元)、INNODBテーブルスペースの問題(IBDATA1ファイルのチェック)、プラグインロード障害(エラーログのチェック)が含まれます。問題を解決するときは、エラーログに基づいてそれらを分析し、問題の根本原因を見つけ、問題を防ぐために定期的にデータをバックアップする習慣を開発する必要があります。

インストール後にMySQLの使用方法 インストール後にMySQLの使用方法 Apr 08, 2025 am 11:48 AM

この記事では、MySQLデータベースの操作を紹介します。まず、MySQLWorkBenchやコマンドラインクライアントなど、MySQLクライアントをインストールする必要があります。 1. mysql-uroot-pコマンドを使用してサーバーに接続し、ルートアカウントパスワードでログインします。 2。CreatedAtaBaseを使用してデータベースを作成し、データベースを選択します。 3. createTableを使用してテーブルを作成し、フィールドとデータ型を定義します。 4. INSERTINTOを使用してデータを挿入し、データをクエリし、更新することでデータを更新し、削除してデータを削除します。これらの手順を習得することによってのみ、一般的な問題に対処することを学び、データベースのパフォーマンスを最適化することでMySQLを効率的に使用できます。

リモートシニアバックエンジニア(プラットフォーム)がサークルが必要です リモートシニアバックエンジニア(プラットフォーム)がサークルが必要です Apr 08, 2025 pm 12:27 PM

リモートシニアバックエンジニアの求人事業者:サークル場所:リモートオフィスジョブタイプ:フルタイム給与:$ 130,000- $ 140,000職務記述書サークルモバイルアプリケーションとパブリックAPI関連機能の研究開発に参加します。ソフトウェア開発ライフサイクル全体をカバーします。主な責任は、RubyonRailsに基づいて独立して開発作業を完了し、React/Redux/Relay Front-Endチームと協力しています。 Webアプリケーションのコア機能と改善を構築し、機能設計プロセス全体でデザイナーとリーダーシップと緊密に連携します。肯定的な開発プロセスを促進し、反復速度を優先します。 6年以上の複雑なWebアプリケーションバックエンドが必要です

mysqlはjsonを返すことができますか mysqlはjsonを返すことができますか Apr 08, 2025 pm 03:09 PM

MySQLはJSONデータを返すことができます。 json_extract関数はフィールド値を抽出します。複雑なクエリについては、Where句を使用してJSONデータをフィルタリングすることを検討できますが、そのパフォーマンスへの影響に注意してください。 JSONに対するMySQLのサポートは絶えず増加しており、最新バージョンと機能に注意を払うことをお勧めします。

酸性特性を理解する:信頼できるデータベースの柱 酸性特性を理解する:信頼できるデータベースの柱 Apr 08, 2025 pm 06:33 PM

データベース酸属性の詳細な説明酸属性は、データベーストランザクションの信頼性と一貫性を確保するための一連のルールです。データベースシステムがトランザクションを処理する方法を定義し、システムのクラッシュ、停電、または複数のユーザーの同時アクセスの場合でも、データの整合性と精度を確保します。酸属性の概要原子性:トランザクションは不可分な単位と見なされます。どの部分も失敗し、トランザクション全体がロールバックされ、データベースは変更を保持しません。たとえば、銀行の譲渡が1つのアカウントから控除されているが別のア​​カウントに増加しない場合、操作全体が取り消されます。 TRANSACTION; updateaccountssetbalance = balance-100wh

MySQLの主な鍵はヌルにすることができます MySQLの主な鍵はヌルにすることができます Apr 08, 2025 pm 03:03 PM

MySQLプライマリキーは、データベース内の各行を一意に識別するキー属性であるため、空にすることはできません。主キーが空になる可能性がある場合、レコードを一意に識別することはできません。これにより、データの混乱が発生します。一次キーとして自己挿入整数列またはUUIDを使用する場合、効率やスペース占有などの要因を考慮し、適切なソリューションを選択する必要があります。

See all articles