目次
方法
ホームページ テクノロジー周辺機器 AI 新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来

新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来

Dec 14, 2023 pm 09:49 PM
モデル 電車

新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来


  • 論文リンク: https://browse.arxiv.org/pdf/2211.13976.pdf
  • GitHub: https://github.com/Vanint/DatasetExpansion
ご存知のとおり、ディープ ニューラル ネットワークのパフォーマンスはトレーニング データに大きく依存します。量と質のせいで、ディープ ラーニングを小規模なデータ タスクに広く適用することが困難になります。たとえば、医療やその他の分野での小規模データのアプリケーション シナリオでは、大規模なデータ セットを手動で収集してラベル付けするのは、多くの場合、時間と労力がかかります。このデータ不足の問題に対処し、データ収集コストを最小限に抑えるために、この論文では、新しいデータを自動的に生成して、ターゲット タスクの小さなデータ セットをより大きく、より情報量の多いデータ セットに拡張することを目的とした、データ セット拡張の新しいパラダイムを検討します。セット。これらの拡張データセットは、モデルのパフォーマンスと汎化機能の向上に特化しており、さまざまなネットワーク構造のトレーニングに使用できます

新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来

この成果は、既存の方法を使用するだけではデータセットを十分に拡張できないということです。 (1) ランダム データ強化は主に画像の表面の視覚特性を変更しますが、新しいオブジェクトの内容を含む画像を作成することはできません (下の画像の蓮は同じであり、新しい蓮は生成されません)。そのため、導入される情報量は限定。さらに深刻なのは、ランダムなデータ強調により、医用画像の病変(変化)位置が切り取られる可能性があり、その結果、サンプルの重要な情報が減少し、さらにはノイズの多いデータが生成される可能性があることです。 (2) データセットの増幅に事前トレーニング済みの生成 (拡散) モデルを直接使用しても、ターゲット タスクでのモデルのパフォーマンスを十分に向上させることはできません。これは、これらの生成モデルの事前トレーニング データには、ターゲット データとの大きな分布の差があることが多く、その結果、生成されるデータとターゲット タスクの間に一定の分布とカテゴリのギャップが生じ、生成されたデータがターゲット タスクと一致することを保証することが不可能であるためです。サンプルには正しいカテゴリとラベルがあり、モデルのトレーニングに役立ちます。

新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来

#より効率的なデータセットの拡張を実現するために、研究者は人間の連合学習を研究してきました。人間は、ある物体についての事前知識があれば、下の写真のさまざまな種類、色、形、背景の犬のバリエーションなど、その物体のさまざまなバリエーションを容易に想像できます。この想像力豊かな学習プロセスは、画像内の動物の外観を単に混乱させるだけでなく、豊富な事前知識を適用して新しい情報を含むさまざまな画像を作成するため、データセットの増幅にとって非常に有益です。

しかし、データ想像力のためのアプリオリなモデルとして人間を直接モデル化することはできません。幸いなことに、最近の生成モデル (安定拡散、DALL-E2 など) は、大規模なデータセットの分布に適合する強力な機能を実証しており、リッチでリアルな画像を生成できます。このことから、この論文では、事前にトレーニングされた生成モデルを事前モデルとして使用し、その強力な事前知識を活用して、小規模なデータセットに対して効率的なデータの関連付けと増幅を実行するようになりました。

新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来

上記のアイデアに基づいて、この研究は新しい Guided Imagination Framework (GIF) を提案します。この方法により、自然画像や医療画像のタスクに対するディープ ニューラル ネットワークの分類パフォーマンスと汎化能力が効果的に向上し、手動によるデータ収集と注釈付けによって生じる膨大なコストが大幅に削減されます。同時に、拡張されたデータセットはモデルの転移学習を促進し、ロングテール問題を軽減するのにも役立ちます。

新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来

次に、このデータセット増幅の新しいパラダイムがどのように設計されているかを見てみましょう。

方法

データセット増幅の課題と指針となる標準 データセット増幅を設計するには 2 つの方法があります。課題: (1) 生成されたサンプルに正しいカテゴリ ラベルを付けるにはどうすればよいでしょうか? (2) 生成されたサンプルにモデルのトレーニングを促進するための新しい情報が含まれていることを確認するにはどうすればよいですか?これら 2 つの課題に対処するために、この研究では広範な実験を通じて 2 つの増幅指針基準、(1) カテゴリ一貫した情報の強化、(2) サンプルの多様性の向上を発見しました。

新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来

方法論的フレームワーク 発見された増幅指針基準に基づいて、この研究は、誘導された想像力の増幅フレームワークを提案します。 (GIF)。各入力シード サンプル x に対して、GIF は最初に前の生成モデルの特徴抽出器を使用してサンプル特徴 f を抽出し、特徴に対してノイズ摂動を実行します: 新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来。ノイズ (z、b) を設定する最も簡単な方法は、ガウス ランダム ノイズを使用することですが、生成されたサンプルに正しいクラス ラベルが付けられ、より多くの情報がもたらされることを保証できません。したがって、効率的なデータセット増幅のために、GIF は発見された増幅ガイドライン、つまり 新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来 に基づいてノイズ摂動を最適化します。

新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来


#使用される増幅ガイダンス標準は次のように実装されます。クラス一貫性のある情報量インデックス: 新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来; サンプル多様性インデックス: 新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来。これら 2 つの指標を最大化することで、GIF はノイズ摂動を効果的に最適化し、それによってカテゴリの一貫性を維持し、より多くの情報コンテンツをもたらすサンプルを生成できます。

実験

増幅効果 GIF はより強い増幅効果を持っています: GIF-SD は、 6 つの自然データセットでは分類精度が平均 36.9% 向上し、3 つの医療データセットでは分類精度が平均 13.5% 向上しました。

新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来

増幅効率 GIF はより強い増幅効率を持っています: 車と DTD データセットでは、 GIF-SD を使用した 5 倍増幅の効果は、ランダム データ拡張を使用した 20 倍増幅の効果をも上回ります。

新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来

#可視化結果 既存のデータ拡張手法では新しい画像コンテンツを生成できませんが、GIF の方がより適切に生成できます。新しいコンテンツを含むサンプル。

新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来

既存の強調方法では、医療画像内の病変の位置がカットされる可能性があり、その結果、サンプル情報とノイズが減少しますが、GIF はより適切に保存されます。セマンティクス

新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来

計算コストと時間コスト 手動によるデータ収集と注釈と比較して、GIF は大幅にコストを削減できます。データセットの増強にかかる時間とコスト。

新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来

増幅されたデータの汎用性 これらのデータセットは、増幅されると、さまざまなニューラル ネットワーク モデルのトレーニングに直接使用できます。構造。

新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来

#モデルの汎化能力の向上 GIF は、モデルの分布外汎化パフォーマンスの向上に役立ちます(OOD の一般化)。

新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来

#ロングテール問題の軽減 GIF はロングテール問題の軽減に役立ちます。

新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来

#安全性チェック

GIF によって生成された画像は安全で無害です。

新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来上記の実験結果に基づいて、人間の類推と想像力の学習をシミュレートすることにより、この論文で設計された方法が効果的に実行できると信じる理由があります。小規模データ セットを増幅することで、小規模データ タスク シナリオにおけるディープ ニューラル ネットワークの実装とアプリケーションが向上します。

以上が新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

オープンソース!ゾーイデプスを超えて! DepthFM: 高速かつ正確な単眼深度推定! オープンソース!ゾーイデプスを超えて! DepthFM: 高速かつ正確な単眼深度推定! Apr 03, 2024 pm 12:04 PM

0.この記事は何をするのですか?私たちは、多用途かつ高速な最先端の生成単眼深度推定モデルである DepthFM を提案します。従来の深度推定タスクに加えて、DepthFM は深度修復などの下流タスクでも最先端の機能を実証します。 DepthFM は効率的で、いくつかの推論ステップ内で深度マップを合成できます。この作品について一緒に読みましょう〜 1. 論文情報タイトル: DepthFM: FastMonocularDepthEstimationwithFlowMatching 著者: MingGui、JohannesS.Fischer、UlrichPrestel、PingchuanMa、Dmytr

世界で最も強力なオープンソース MoE モデルが登場。GPT-4 に匹敵する中国語機能を備え、価格は GPT-4-Turbo のわずか 1% 近くです 世界で最も強力なオープンソース MoE モデルが登場。GPT-4 に匹敵する中国語機能を備え、価格は GPT-4-Turbo のわずか 1% 近くです May 07, 2024 pm 04:13 PM

従来のコンピューティングを超える能力を備えているだけでなく、より低コストでより効率的なパフォーマンスを実現する人工知能モデルを想像してみてください。これは SF ではありません。世界で最も強力なオープンソース MoE モデルである DeepSeek-V2[1] が登場しました。 DeepSeek-V2 は、経済的なトレーニングと効率的な推論の特徴を備えた強力な専門家混合 (MoE) 言語モデルです。これは 236B のパラメータで構成されており、そのうち 21B は各マーカーをアクティブにするために使用されます。 DeepSeek67B と比較して、DeepSeek-V2 はパフォーマンスが優れていると同時に、トレーニング コストを 42.5% 節約し、KV キャッシュを 93.3% 削減し、最大生成スループットを 5.76 倍に高めます。 DeepSeek は一般的な人工知能を研究する会社です

こんにちは、電気アトラスです!ボストン・ダイナミクスのロボットが復活、180度の奇妙な動きにマスク氏も恐怖 こんにちは、電気アトラスです!ボストン・ダイナミクスのロボットが復活、180度の奇妙な動きにマスク氏も恐怖 Apr 18, 2024 pm 07:58 PM

Boston Dynamics Atlas は正式に電動ロボットの時代に突入します!昨日、油圧式アトラスが歴史の舞台から「涙ながらに」撤退したばかりですが、今日、ボストン・ダイナミクスは電動式アトラスが稼働することを発表しました。ボストン・ダイナミクス社は商用人型ロボットの分野でテスラ社と競争する決意を持っているようだ。新しいビデオが公開されてから、わずか 10 時間ですでに 100 万人以上が視聴しました。古い人が去り、新しい役割が現れるのは歴史的な必然です。今年が人型ロボットの爆発的な年であることは間違いありません。ネットユーザーは「ロボットの進歩により、今年の開会式は人間のように見え、人間よりもはるかに自由度が高い。しかし、これは本当にホラー映画ではないのか?」とコメントした。ビデオの冒頭では、アトラスは仰向けに見えるように地面に静かに横たわっています。次に続くのは驚くべきことです

MLP に代わる KAN は、オープンソース プロジェクトによって畳み込みまで拡張されました MLP に代わる KAN は、オープンソース プロジェクトによって畳み込みまで拡張されました Jun 01, 2024 pm 10:03 PM

今月初め、MIT やその他の機関の研究者らは、MLP に代わる非常に有望な代替案である KAN を提案しました。 KAN は、精度と解釈可能性の点で MLP よりも優れています。また、非常に少数のパラメーターを使用して、多数のパラメーターを使用して実行する MLP よりも優れたパフォーマンスを発揮できます。たとえば、著者らは、KAN を使用して、より小規模なネットワークと高度な自動化で DeepMind の結果を再現したと述べています。具体的には、DeepMind の MLP には約 300,000 個のパラメーターがありますが、KAN には約 200 個のパラメーターしかありません。 KAN は、MLP が普遍近似定理に基づいているのに対し、KAN はコルモゴロフ-アーノルド表現定理に基づいているのと同様に、強力な数学的基礎を持っています。以下の図に示すように、KAN は

AI が数学研究を破壊する!フィールズ賞受賞者で中国系アメリカ人の数学者が上位 11 件の論文を主導 | テレンス・タオが「いいね!」しました AI が数学研究を破壊する!フィールズ賞受賞者で中国系アメリカ人の数学者が上位 11 件の論文を主導 | テレンス・タオが「いいね!」しました Apr 09, 2024 am 11:52 AM

AI は確かに数学を変えつつあります。最近、この問題に細心の注意を払っている陶哲軒氏が『米国数学協会会報』(米国数学協会会報)の最新号を送ってくれた。 「機械は数学を変えるのか?」というテーマを中心に、多くの数学者が意見を述べ、そのプロセス全体は火花に満ち、ハードコアで刺激的でした。著者には、フィールズ賞受賞者のアクシャイ・ベンカテシュ氏、中国の数学者鄭楽軍氏、ニューヨーク大学のコンピューター科学者アーネスト・デイビス氏、その他業界で著名な学者を含む強力な顔ぶれが揃っている。 AI の世界は劇的に変化しています。これらの記事の多くは 1 年前に投稿されたものです。

超知性の生命力が覚醒する!しかし、自己更新 AI の登場により、母親はデータのボトルネックを心配する必要がなくなりました。 超知性の生命力が覚醒する!しかし、自己更新 AI の登場により、母親はデータのボトルネックを心配する必要がなくなりました。 Apr 29, 2024 pm 06:55 PM

世界は狂ったように大きなモデルを構築していますが、インターネット上のデータだけではまったく不十分です。このトレーニング モデルは「ハンガー ゲーム」のようであり、世界中の AI 研究者は、データを貪欲に食べる人たちにどのように餌を与えるかを心配しています。この問題は、マルチモーダル タスクで特に顕著です。何もできなかった当時、中国人民大学学部のスタートアップチームは、独自の新しいモデルを使用して、中国で初めて「モデル生成データフィード自体」を実現しました。さらに、これは理解側と生成側の 2 つの側面からのアプローチであり、両方の側で高品質のマルチモーダルな新しいデータを生成し、モデル自体にデータのフィードバックを提供できます。モデルとは何ですか? Awaker 1.0 は、中関村フォーラムに登場したばかりの大型マルチモーダル モデルです。チームは誰ですか?ソフォンエンジン。人民大学ヒルハウス人工知能大学院の博士課程学生、ガオ・イージャオ氏によって設立されました。

Kuaishou バージョンの Sora「Ke Ling」がテスト用に公開されています。120 秒以上のビデオを生成し、物理学をより深く理解し、複雑な動きを正確にモデル化できます。 Kuaishou バージョンの Sora「Ke Ling」がテスト用に公開されています。120 秒以上のビデオを生成し、物理学をより深く理解し、複雑な動きを正確にモデル化できます。 Jun 11, 2024 am 09:51 AM

何?ズートピアは国産AIによって実現するのか?ビデオとともに公開されたのは、「Keling」と呼ばれる新しい大規模な国産ビデオ生成モデルです。 Sora も同様の技術的ルートを使用し、自社開発の技術革新を多数組み合わせて、大きく合理的な動きをするだけでなく、物理世界の特性をシミュレートし、強力な概念的結合能力と想像力を備えたビデオを制作します。データによると、Keling は、最大 1080p の解像度で 30fps で最大 2 分の超長時間ビデオの生成をサポートし、複数のアスペクト比をサポートします。もう 1 つの重要な点は、Keling は研究所が公開したデモやビデオ結果のデモンストレーションではなく、ショートビデオ分野のリーダーである Kuaishou が立ち上げた製品レベルのアプリケーションであるということです。さらに、主な焦点は実用的であり、白紙小切手を書かず、リリースされたらすぐにオンラインに移行することです。Ke Ling の大型モデルは Kuaiying でリリースされました。

アメリカ空軍が初のAI戦闘機を公開し注目を集める!大臣はプロセス全体を通じて干渉することなく個人的にテストを実施し、10万行のコードが21回にわたってテストされました。 アメリカ空軍が初のAI戦闘機を公開し注目を集める!大臣はプロセス全体を通じて干渉することなく個人的にテストを実施し、10万行のコードが21回にわたってテストされました。 May 07, 2024 pm 05:00 PM

最近、軍事界は、米軍戦闘機が AI を使用して完全自動空戦を完了できるようになったというニュースに圧倒されました。そう、つい最近、米軍のAI戦闘機が初めて公開され、その謎が明らかになりました。この戦闘機の正式名称は可変安定性飛行シミュレーター試験機(VISTA)で、アメリカ空軍長官が自ら飛行させ、一対一の空戦をシミュレートした。 5 月 2 日、フランク ケンダル米国空軍長官は X-62AVISTA でエドワーズ空軍基地を離陸しました。1 時間の飛行中、すべての飛行動作が AI によって自律的に完了されたことに注目してください。ケンダル氏は「過去数十年にわたり、私たちは自律型空対空戦闘の無限の可能性について考えてきたが、それは常に手の届かないものだと思われてきた」と語った。しかし今では、

See all articles