VAE表現学習の問題を解決するために、北海道大学は新しい生成モデルGWAEを提案しました-AI-php.cn

データ配布と潜在的な事前配布の間 GW ターゲット

実験と結果

概要

ホームページ

テクノロジー周辺機器

VAE表現学習の問題を解決するために、北海道大学は新しい生成モデルGWAEを提案しました

王林

Apr 07, 2023 pm 05:47 PM

フレームデータ

高次元データの低次元表現の学習は、教師なし学習の基本的なタスクです。そのような表現はデータの本質を簡潔に捉えており、低次元の入力に基づいた下流タスクの実行を可能にするためです。可能です。変分オートエンコーダ (VAE) は重要な表現学習方法ですが、その客観的な制御のため、表現学習は依然として困難な作業です。 VAE の証拠下限 (ELBO) 目標は生成的にモデル化されていますが、学習表現はこの目標を直接ターゲットにしていないため、もつれの解除など、表現学習タスクに対する特定の修正が必要です。これらの変更はモデルに暗黙的な望ましくない変更をもたらす場合があり、制御された表現の学習が困難なタスクになります。

変分オートエンコーダにおける表現学習問題を解決するために、この論文では Gromov-Wasserstein Autoencoders (GWAE) と呼ばれる新しい生成モデルを提案します。 GWAE は、変分オートエンコーダー (VAE) モデルアーキテクチャに基づいた表現学習のための新しいフレームワークを提供します。データ変数の生成モデリングのための従来の VAE ベースの表現学習方法とは異なり、GWAE はデータと潜在変数間の最適な転送を通じて有益な表現を取得します。 Gromov-Wasserstein (GW) メトリックは、考慮中の変数の距離構造に焦点を当てた、比較できない変数 (たとえば、異なる次元を持つ変数) 間のこのような最適な転送を可能にします。 ELBO 目標を GW メトリックに置き換えることにより、GWAE はデータと潜在空間の間の比較を実行し、変分オートエンコーダーでの表現学習を直接ターゲットにします (図 1)。この表現学習の定式化により、学習された表現は、メタ事前条件と呼ばれる、有益と考えられる特定の特性 (分解可能性など) を持つことができます。

VAE表現学習の問題を解決するために、北海道大学は新しい生成モデルGWAEを提案しました

図 1 VAE と GWAE の違い

##この研究では、 ICLR 2023 に大幅に承認されました。

メソッドの紹介

データ配布と潜在的な事前配布の間 GW ターゲット

VAE表現学習の問題を解決するために、北海道大学は新しい生成モデルGWAEを提案しましたこの最適伝送コストの公式は、比類のない空間における分布の不一致を測定できますが、連続的な分布の場合、それは次のように定義されます。すべての結合を下限にする必要があるため、正確な GW 値を計算することは非現実的です。この問題を解決するために、GWAE は緩和された最適化問題を解き、GW 推定量を推定して最小化します。その勾配は自動微分によって計算できます。緩和ターゲットは、推定された GW メトリックと 3 つの正則化損失の合計であり、これらはすべて PyTorch などの微分可能なプログラミングフレームワークで実装できます。この緩和目標は、主損失と 3 つの正則化損失、つまり主推定 GW 損失、WAE ベースの再構成損失、結合十分条件損失、およびエントロピー正則化損失で構成されます。

このスキームは、事前分布を柔軟にカスタマイズして、低次元表現に有益な特徴を導入することもできます。具体的には、この論文では次の 3 つの事前集団を紹介しています。

Neural Priori (NP) In GWAEs with NP、完全に接続されたニューラルネットワークは、アプリオリサンプラーを構築するために使用されます。この事前分布ファミリーは、基礎となる変数に関する仮定が少なく、一般的な状況に適しています。

因数分解ニューラル事前分布 (FNP)FNP を使用した GWAE では、ローカルに接続されたニューラル事前分布を使用します。ネットワークは、各潜在変数のエントリが独立して生成されるサンプラー。このサンプラーは、因数分解された事前表現と用語に依存しない表現を生成します。これは、代表的なメタ事前分散の優れた方法です。

ガウス混合事前分布 (GMP) GMP では、複数のガウス分布の混合として定義され、そのサンプラーは重度のガウス分布を使用できます。パラメータ化手法と Gumbel-Max 手法が実装されています。 GMP では、事前分布の各ガウス成分がクラスターを捕捉すると予想される表現でクラスターを仮説化することができます。

実験と結果

この研究では、GWAE の 2 つの主要なメタ事前実証的評価を実施しました:ソリューションエンタングルメントとクラスタリング。

解絡研究では、3D Shapes データセットと DCI メトリクスを使用して、GWAE の解絡能力を測定しました。結果は、FNP を使用した GWAE が単一軸上でオブジェクトの色相因子を学習できることを示しており、これは GWAE のもつれを解く能力を実証しています。定量的評価によっても、GWAE の解絡性能が実証されます。

VAE表現学習の問題を解決するために、北海道大学は新しい生成モデルGWAEを提案しました

クラスタリング クラスタリング要素の事前確率に基づいて得られた表現を評価するために、研究では、アウト・オブ・分布 (OOD) 検出。 MNIST データセットは In-Distribution (ID) データとして使用され、Omniglot データセットは OoD データとして使用されます。 MNIST には手書きの数字が含まれていますが、Omniglot には異なる文字の手書き文字が含まれています。この実験では、ID データセットと OoD データセットは手書き画像のドメインを共有していますが、異なる文字が含まれています。モデルは ID データでトレーニングされ、学習した表現を使用して ID または OoD データを検出します。 VAE と DAGMM では、OoD 検出に使用される変数は事前対数尤度ですが、GWAE ではカントロビッチポテンシャルです。 GWAE の事前分布は、MNIST のクラスターをキャプチャするために GMP を使用して構築されました。 ROC 曲線はモデルの OoD 検出パフォーマンスを示しており、3 つのモデルすべてがほぼ完璧なパフォーマンスを達成していますが、曲線下面積 (AUC) に関しては GMP を使用して構築された GWAE が最も優れたパフォーマンスを示しました。

VAE表現学習の問題を解決するために、北海道大学は新しい生成モデルGWAEを提案しました

さらに、この研究では GWAE の生成能力も評価しました。

オートエンコーダベースの生成モデルとしてのパフォーマンス 特定のメタ事前条件なしで一般的なケースを処理する GWAE の能力を評価するために、CelebA データが使用されます。発電性能を評価した。この実験では、FID を使用してモデルの生成パフォーマンスを評価し、PSNR を使用して自動エンコーディングのパフォーマンスを評価します。 GWAE は、NP を使用して 2 番目に優れた生成パフォーマンスと最高の自動エンコーディングパフォーマンスを達成し、モデル内のデータ分布をキャプチャし、その表現でデータ情報をキャプチャできる能力を実証しました。

VAE表現学習の問題を解決するために、北海道大学は新しい生成モデルGWAEを提案しました

概要

GWAE は、Gromov-Wasserstein 計量に基づいて構築された変分オートエンコーダ生成モデルであり、直接的な目標を達成することを目的としています。表現学習。
事前分布は微分可能なサンプルのみを必要とするため、メタ事前分布 (表現の理想的な特性) を仮定するためにさまざまな事前分布設定を構築できます。
プライマリメタプリアの実験と変分オートエンコーダとしてのパフォーマンス評価は、GWAE 定式化の柔軟性と GWAE の表現学習機能を示しています。
筆頭著者中川直の個人ホームページ: https://ganmodokix.com/note/cv
# #北海道大学マルチメディア研究室ホームページ：https://www-lmd.ist.hakudai.ac.jp/

以上がVAE表現学習の問題を解決するために、北海道大学は新しい生成モデルGWAEを提案しましたの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

神レベルのコード編集ソフト（SublimeText3）

ホットトピック

Gmailメールのログイン入り口はどこですか？

7554

CakePHP チュートリアル

1382

Steamのアカウント名の形式は何ですか

Win11 Activation Key Permanent

NYTの接続はヒントと回答です

Related knowledge

AI スタートアップ企業は一斉に OpenAI に転職し、イリヤが去った後にセキュリティチームが再編成されました。 Jun 08, 2024 pm 01:00 PM

先週、社内の辞任と社外からの批判が相次ぐ中、OpenAIは内外のトラブルに見舞われた。 - 未亡人姉妹への侵害が世界中で白熱した議論を巻き起こした - 「覇権条項」に署名した従業員が次々と暴露 - ネットユーザーがウルトラマンの「」をリストアップ噂の払拭: Vox が入手した漏洩情報と文書によると、アルトマンを含む OpenAI の上級幹部はこれらの株式回収条項をよく認識しており、承認しました。さらに、OpenAI には、AI セキュリティという深刻かつ緊急の課題が直面しています。最近、最も著名な従業員2名を含むセキュリティ関連従業員5名が退職し、「Super Alignment」チームが解散したことで、OpenAIのセキュリティ問題が再び注目を集めている。フォーチュン誌は OpenA を報じた。

Java フレームワークの商用サポートの費用対効果を評価する方法 Jun 05, 2024 pm 05:25 PM

Java フレームワークの商用サポートのコスト/パフォーマンスを評価するには、次の手順が必要です。必要な保証レベルとサービスレベルアグリーメント (SLA) 保証を決定します。研究サポートチームの経験と専門知識。アップグレード、トラブルシューティング、パフォーマンスの最適化などの追加サービスを検討してください。ビジネスサポートのコストと、リスクの軽減と効率の向上を比較検討します。

70B モデルは数秒で 1,000 トークンを生成、コード書き換えは GPT-4o を超える、OpenAI が投資したコード成果物である Cursor チームによる Jun 13, 2024 pm 03:47 PM

70B モデルでは、数秒で 1,000 個のトークンを生成でき、これはほぼ 4,000 文字に相当します。研究者らは Llama3 を微調整し、高速化アルゴリズムを導入しました。ネイティブバージョンと比較して、速度は 13 倍高速になりました。速いだけでなく、コード書き換えタスクのパフォーマンスは GPT-4o をも上回ります。この成果は、人気の AI プログラミング成果物 Cursor を開発したチーム、anysphere によるもので、OpenAI も投資に参加しました。有名な高速推論アクセラレーションフレームワークである Groq では、70BLlama3 の推論速度は 1 秒あたり 300 トークンを超える程度であることを知っておく必要があります。 Cursor の速度により、ほぼ瞬時に完全なコードファイル編集を実現すると言えます。カースと言うと良い奴だと言う人もいる

PHP フレームワークの学習曲線は他の言語フレームワークと比較してどうですか? Jun 06, 2024 pm 12:41 PM

PHP フレームワークの学習曲線は、言語熟練度、フレームワークの複雑さ、ドキュメントの品質、コミュニティのサポートによって異なります。 PHP フレームワークの学習曲線は、Python フレームワークと比較すると高く、Ruby フレームワークと比較すると低くなります。 Java フレームワークと比較すると、PHP フレームワークの学習曲線は中程度ですが、開始までの時間は短くなります。

PHP フレームワークの軽量オプションはアプリケーションのパフォーマンスにどのような影響を与えますか? Jun 06, 2024 am 10:53 AM

軽量の PHP フレームワークは、サイズが小さくリソース消費が少ないため、アプリケーションのパフォーマンスが向上します。その特徴には、小型、高速起動、低メモリ使用量、改善された応答速度とスループット、および削減されたリソース消費が含まれます。実際のケース: SlimFramework は、わずか 500 KB、高い応答性と高スループットの REST API を作成します。

チャイナモバイル：人類は第4次産業革命を迎え、「3つの計画」を正式発表 Jun 27, 2024 am 10:29 AM

6月26日のニュースによると、2024年世界移動通信会議上海（MWC上海）の開会式で、チャイナモバイル会長の楊潔氏がスピーチを行った。現在、人類社会は情報が支配し、情報とエネルギーが深く融合する第4次産業革命、すなわち「デジタルインテリジェンス革命」を迎えており、新たな生産力の形成が加速していると述べた。楊潔氏は、蒸気機関による「機械化革命」から、電気や内燃機関による「電化革命」、コンピューターやインターネットによる「情報革命」に至るまで、各段階の産業革命は、「情報」と「エネルギー」が生産性向上をもたらす幹線

さまざまなアプリケーションシナリオに最適な Golang フレームワークを選択する方法 Jun 05, 2024 pm 04:05 PM

アプリケーションのシナリオに基づいて最適な Go フレームワークを選択します。アプリケーションの種類、言語機能、パフォーマンス要件、エコシステムを考慮します。一般的な Go フレームワーク: Jin (Web アプリケーション)、Echo (Web サービス)、Fiber (高スループット)、gorm (ORM)、fasthttp (速度)。実際のケース: REST API (Fiber) の構築とデータベース (gorm) との対話。フレームワークを選択します。主要なパフォーマンスには fasthttp、柔軟な Web アプリケーションには Jin/Echo、データベースインタラクションには gorm を選択してください。

Googleの検索アルゴリズムの内幕が明らかになり、2,500ページに及ぶ文書が実名で流出！検索ランキングの嘘が暴露される Jun 11, 2024 am 09:14 AM

最近、Google の内部文書 2,500 ページが流出し、「インターネットの最も強力な裁定者」である検索がどのように機能するかが明らかになりました。 SparkToro の共同創設者兼 CEO は匿名の人物であり、自身のウェブサイトにブログ投稿を公開し、「匿名の人物が、SEO 関係者全員が読むべき、何千ページもの Google Search API ドキュメントを私に共有してくれた」と主張しました。 ! 「長年にわたり、ランドフィッシュキン氏は SEO (検索エンジン最適化、検索エンジン最適化) の分野でトップのスポークスマンを務めており、「ウェブサイトの権威」(DomainRating) という概念を提案しました。彼はこの分野で非常に尊敬されているので、RandFishkin

See all articles

VAE表現学習の問題を解決するために、北海道大学は新しい生成モデルGWAEを提案しました

データ配布と潜在的な事前配布の間 GW ターゲット

実験と結果

概要

ホットAIツール

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

人気の記事

ホットツール

メモ帳++7.3.1

SublimeText3 中国語版

ゼンドスタジオ 13.0.1

ドリームウィーバー CS6

SublimeText3 Mac版

ホットトピック