TRIBE はドメイン適応の堅牢性を実現し、複数の現実のシナリオで SOTA の AAAII 2024 に到達します。-AI-php.cn

ホームページ

テクノロジー周辺機器

TRIBE はドメイン適応の堅牢性を実現し、複数の現実のシナリオで SOTA の AAAII 2024 に到達します。

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jan 01, 2024 am 10:38 AM

プロジェクト

テスト時適応の目的は、推論フェーズでソースドメインモデルをテストデータに適応させることであり、未知の画像損傷フィールドへの適応において優れた結果を達成しました。ただし、現在の手法の多くは、現実のシナリオにおけるテストデータフローを考慮していません。たとえば、次のようになります。

テストデータフローは、時間変動する分布 (従来のドメイン適応における固定分布ではなく)
テストデータストリームには、(完全に独立した同一に分布したサンプリングではなく) ローカルクラス相関がある可能性があります
テストデータストリームでは、長期間にわたって依然として世界的なカテゴリの不均衡が示されています

#最近、中国南部ではA* 工科大学 STAR チームと CUHK-Shenzhen チームは、これらの実際のシナリオでのデータフローのテストが既存の手法に大きな課題をもたらすことを、多数の実験を通じて証明しました。研究チームは、最先端の手法の失敗は、まず不均衡なテストデータに基づいて正規化層を無差別に調整することが原因であると考えています。

この目的を達成するために、研究チームは

従来の推論フェーズのバッチ正規化層を置き換える革新的なBalanced BatchNorm層(Balanced BatchNorm層)を提案しました。同時に、未知のテストデータストリームでの学習を自己トレーニング (ST) のみに依存すると、過剰適応 (疑似ラベルカテゴリの不均衡、ターゲットドメインが固定ドメインではない) につながりやすく、その結果、パフォーマンスが低下する可能性があることがわかりました。変化するドメインでのパフォーマンス。

したがって、チームは

アンカー損失 (アンカー損失) を通じてモデル更新を正規化することを推奨しますこれにより、継続的なドメイン転送の下での自立性が向上しますトレーニングは大幅に役立ちますモデルの堅牢性が向上します。最終的に、モデル TRIBE は 4 つのデータセットと複数の実世界テストデータストリーム設定の下で安定して最先端のパフォーマンスを達成し、既存の高度な手法を大幅に上回りました。研究論文がAAAI 2024に採択されました。

AAAI 2024 | 测试时领域适应的鲁棒性得以保证，TRIBE在多真实场景下达到SOTA

論文リンク: https://arxiv.org/abs/2309.14949

コードリンク: https://github.com/Gorilla-Lab- SCUT/TRIBE

はじめに

ディープニューラルネットワークの成功は、トレーニングされたモデルをテストドメインの想定に合わせて一般化するかどうかにかかっています。。ただし、実際のアプリケーションでは、異なる照明条件や悪天候によって引き起こされる視覚的な損傷など、配布外のテストデータの堅牢性が懸念されます。最近の研究では、このデータ損失が事前トレーニングされたモデルのパフォーマンスに重大な影響を与える可能性があることが示されています。重要なのは、テストデータの破損 (配布) は不明なことが多く、展開前には予測できない場合もあります。

したがって、推論段階でテストデータの分布に適応するように事前トレーニングされたモデルを調整することは、価値のある新しいトピック、つまりテスト時ドメイン適応 (TTA) です。これまで、TTA は主に分布調整 (TTAC、TTT)、自己教師ありトレーニング (AdaContrast)、および自己トレーニング (Conjugate PL) を通じて実装されていました。これにより、さまざまな視覚的損傷テストデータに大幅かつ堅牢な改善がもたらされました。

既存のテスト時ドメイン適応 (TTA) 方法は、通常、安定したクラス分布、サンプルが独立した同一分布のサンプリングに従う、固定ドメインオフセットなど、いくつかの厳密なテストデータの仮定に基づいています。これらの仮定に触発されて、多くの研究者が CoTTA、NOTE、SAR、RoTTA などの現実世界のテストデータフローを調査するようになりました。

最近、SAR (ICLR 2023) や RoTTA (CVPR 2023) などの現実世界の TTA に関する研究は、ローカルクラスの不均衡と TTA への継続的なドメインシフトによってもたらされる課題に主に焦点を当ててきました。ローカルクラスの不均衡は、通常、テストデータが独立して同じように分散してサンプリングされていないという事実から生じます。直接的に無差別にドメインを適応させると、偏った分布推定が行われます。

最近の研究では、この課題を解決するために、指数関数的に更新されるバッチ正規化統計 (RoTTA) またはインスタンスレベルの識別更新バッチ正規化統計 (NOTE) が提案されています。研究の目標は、テストデータの全体的な分布が著しく不均衡である可能性があり、クラスの分布も時間の経過とともに変化する可能性があることを考慮して、ローカルクラスの不均衡という課題を克服することです。より困難なシナリオの図を以下の図 1 に示します。

AAAI 2024 | 测试时领域适应的鲁棒性得以保证，TRIBE在多真实场景下达到SOTA

テストデータ内のクラスの蔓延は推論段階の前には不明であり、ブラインドテスト時間の調整によってモデルが多数派のクラスに偏る可能性があるため、既存の TTA メソッドは無効になります。経験的観察に基づくと、この問題は、正規化層 (BN、PL、TENT、CoTTA など) を更新するためのグローバル統計を推定するために現在のデータバッチに依存する方法で特に顕著になります。

これは主に:

1. 現在のデータバッチはローカルカテゴリの不均衡の影響を受け、全体的な分布推定に偏りが生じます。

2. グローバルクラスの不均衡を伴うテストデータ全体から単一のグローバル分布を推定するグローバル分布は容易に多数派クラスに偏り、内部共変量シフトが発生する可能性があります。

偏ったバッチ正規化 (BN) を回避するために、チームはバランスの取れたバッチ正規化レイヤー (バランスバッチ正規化レイヤー) を提案しました。モデル化され、クラス分布からグローバル分布が抽出されます。バランスの取れたバッチ正規化レイヤーにより、ローカルおよびグローバルにクラス不均衡なテストデータストリームの下で、クラスバランスのとれた分布推定値を取得できます。

ドメインのシフトは、照明や気象条件の段階的な変化など、時間の経過とともに現実世界のテストデータで頻繁に発生します。これは、既存の TTA 方法に別の課題をもたらします。ドメイン A への過剰適応により、ドメイン A からドメイン B に切り替えるときに TTA モデルが矛盾する可能性があります。

特定の短期領域への過剰適応を軽減するために、CoTTA はパラメータをランダムに復元し、EATA はフィッシャー情報を使用してパラメータを正規化します。それにもかかわらず、これらの方法は、テストデータの分野で新たに生じている課題にまだ明示的に対処していません。

この記事では、2 ブランチ自己トレーニングアーキテクチャに基づいた 3 ネットワーク自己トレーニングモデル (Tri-Net Self-Training) を形成するためのアンカーネットワーク (Anchor Network) を紹介します。アンカーネットワークは凍結されたソースモデルですが、テストサンプルを介してバッチ正規化レイヤーのパラメーターではなく統計を調整できます。また、アンカリング損失は、アンカーネットワークの出力を使用して教師モデルの出力を正規化し、ネットワークが局所的な分布に過剰に適応するのを避けるために提案されています。

最終モデルは、3 ネットセルフトレーニングモデルとバランスのとれたバッチ正規化レイヤー (BalancEd 正規化を備えた TRI-ネットセルフトレーニング、TRIBE) を組み合わせて、調整可能な学習率のより広い範囲で良好なパフォーマンスを発揮します。優れた性能。これは、4 つのデータセットと複数の実世界のデータストリームの下で大幅なパフォーマンスの向上を示し、独自の安定性と堅牢性を示しています。

#メソッドの紹介

##ペーパーメソッドは 3 つの部分に分かれています:

実世界における TTA プロトコルの紹介;
バランスのとれたバッチ正規化;
3 つのネットワークの自己学習モデル。

#現実世界の TTA プロトコル

##著者は数学的確率モデルを使用して、ローカルクラスの不均衡とグローバルクラスの不均衡、および時間の経過とともに変化するドメイン分布を含む現実世界のテストデータフローをモデル化します。以下の図 2 に示すように。

AAAI 2024 | 测试时领域适应的鲁棒性得以保证，TRIBE在多真实场景下达到SOTA #バランスバッチ正規化

BN の不均衡なテストデータを修正するには統計によって生成されるバイアスを推定するために、著者はバランスの取れたバッチ正規化層を提案します。これは、次のように表現される各セマンティッククラスの統計のペアを維持します。

カテゴリ統計を更新するには、著者は、以下に示すように、擬似ラベル予測を利用して効率的な反復更新方法を適用します。

疑似ラベルを使用してデータの各カテゴリのサンプリングポイントを個別にカウントし、次の式を使用してカテゴリバランスの下で全体の分布統計を再取得し、ソースを揃えます。カテゴリバランスデータ学習に適した特徴空間。 AAAI 2024 | 测试时领域适应的鲁棒性得以保证，TRIBE在多真实场景下达到SOTA

いくつかの特殊なケースでは、カテゴリの数が大きい AAAI 2024 | 测试时领域适应的鲁棒性得以保证，TRIBE在多真实场景下达到SOTA

または擬似ラベルの精度が低い(精度

AAAI 2024 | 测试时领域适应的鲁棒性得以保证，TRIBE在多真实场景下达到SOTA

さらなる分析と観察を通じて、著者は、 γ = 1 の場合、γ = 0 の場合、更新戦略全体が RoTTA の RobustBN 更新戦略に縮退することがわかりました。γ = 0 の場合、純粋にカテゴリーに依存しない更新戦略です。したがって、γ が 0 ～ 1 の値を取る場合、、さまざまな状況に適応できます。

#3 ネットワーク自己訓練モデル

著者いくつかの生徒-教師モデルに基づいて、アンカリングネットワークブランチが追加され、アンカリング損失が導入されて教師ネットワークの予測分布が制限されます。このデザインはTTACからインスピレーションを得たものです。 TTAC は、テストデータストリームでの自己学習のみに依存すると、確証バイアスの蓄積につながりやすいと指摘していますが、この問題は、この記事で取り上げる現実世界のテストデータストリームではより深刻です。 TTAC は、ソースドメインから収集された統計情報を使用してドメインアラインメントの正規化を実装しますが、完全な TTA 設定の場合、このソースドメイン情報は収集できません。

同時に、著者は別の啓示も得ました。教師なしドメインアライメントの成功は、2 つのドメイン分布の重複率が比較的高いという仮定に基づいています。したがって、著者は、教師モデルの予測分布がソースモデルの予測分布から大きく逸脱しないように、BN 統計量の凍結されたソースドメインモデルを調整して教師モデルを正規化するだけでした (これにより、2 つの間の高い一致率という以前の経験が破壊されました)分布）観察）。多数の実験により、この記事の発見と革新が正しく、確実であることが証明されています。アンカリング損失の式は次のとおりです。

AAAI 2024 | 测试时领域适应的鲁棒性得以保证，TRIBE在多真实场景下达到SOTA

# 次の図は、TRIBE ネットワークのフレーム図を示します。

AAAI 2024 | 测试时领域适应的鲁棒性得以保证，TRIBE在多真实场景下达到SOTA

##実験部分

論文の著者は、2 つの実際の TTA プロトコルに基づいて 4 つのデータセットに対して TRIBE を実施しました。検証されました。実際の TTA プロトコルには、グローバルクラス分布が固定されている GLI-TTA-F と、グローバルクラス分布が固定されていない GLI-TTA-V の 2 つがあります。

AAAI 2024 | 测试时领域适应的鲁棒性得以保证，TRIBE在多真实场景下达到SOTA

上の表は、異なる不均衡係数の下での CIFAR10-C データセット内の 2 つのプロトコルのパフォーマンスを示しています。次の結論が得られます:

1. のみ論文で提案されている LAME、TTAC、NOTE、RoTTA、および TRIBE は TEST ベースラインを超えており、実際のテストフローではより堅牢な TTA 手法の必要性を示しています。

2. グローバルクラスの不均衡は、既存の TTA メソッドに大きな課題をもたらしています。たとえば、以前の SOTA メソッド RoTTA は、I.F.=1 の場合に 25.20% のエラー率を示しましたが、 I.F.=200ではエラー率が32.45%まで上昇しますが、それに比べてTRIBEは比較的良好なパフォーマンスを安定して発揮できます。

3. TRIBE の一貫性は、これまでのすべてのメソッドを上回り、以前の SOTA を超える絶対的な利点があります (グローバルクラスバランス (I.F.=1) TTAC の設定の下) ) 約 7% 向上し、より困難なグローバルクラスインバランス (I.F.=200) 設定では約 13% のパフォーマンス向上を達成しました。

4. I.F.=10 から I.F.=200 まで、他の TTA メソッドは、不均衡が増大するにつれてパフォーマンスが低下する傾向を示します。 TRIBEは比較的安定したパフォーマンスを維持できます。これは、深刻なクラスの不均衡とアンカリング損失をより適切に考慮するバランスの取れたバッチ正規化レイヤーの導入によるもので、異なるドメインにわたる過剰適応が回避されます。

データセットの結果の詳細については、元の論文を参照してください。

さらに、表 4 はモジュール式アブレーションの詳細を示しており、以下の観察結果が得られます。

AAAI 2024 | 测试时领域适应的鲁棒性得以保证，TRIBE在多真实场景下达到SOTA

1. のみBN をバランスの取れたバッチ正規化層 (Balanced BN) に置き換え、モデルパラメーターを更新せず、フォワードを通じて BN 統計のみを更新すると、10.24% (44.62 -> 34.28) のパフォーマンス向上がもたらされ、Robust BN の誤差を上回ります。率は41.97%。

2. 以前の BN 構造でも最新のバランス BN 構造でも、アンカー損失とセルフトレーニングを組み合わせると、パフォーマンスが向上し、モデルの EMA 正則化効果を上回りました。

この記事の残りの部分と 9 ページの付録では、最後に 17 件の詳細な表結果を示し、TRIBE の安定性、堅牢性、優位性を多面的に示します。付録には、バランスのとれたバッチ正規化層のより詳細な理論的導出と説明も含まれています。

#概要と展望

##実世界非 i.i.d. テストデータフロー、世界的なクラスの不均衡、継続的なドメイン転送などの多くの課題に直面して、研究チームはテスト時のドメイン適応アルゴリズムの堅牢性を向上させる方法を深く検討しました。不均衡なテストデータに適応するために、著者は統計の不偏推定を実現する平衡バッチノーム層を提案し、その後、生徒ネットワーク、教師ネットワーク、アンカーネットワークを含むネットワークを提案しました。自己トレーニングをベースにしたTTA。

しかし、この記事にはまだ欠点があり、改善の余地があります。多くの実験と出発点は分類タスクと BN モジュールに基づいているため、適応させる必要はありません他のタスクや Transformer ベースのモデルに影響を与える可能性がありますが、その程度は不明です。これらの問題は、フォローアップ作業でさらなる研究と調査が必要です。

以上がTRIBE はドメイン適応の堅牢性を実現し、複数の現実のシナリオで SOTA の AAAII 2024 に到達します。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

神レベルのコード編集ソフト（SublimeText3）

ホットトピック

Gmailメールのログイン入り口はどこですか？

7425

CakePHP チュートリアル

1359

Steamのアカウント名の形式は何ですか

Win11 Activation Key Permanent

Related knowledge

ControlNet の作者がまたヒット作を出しました!写真から絵画を生成し、2 日間で 1.4,000 個のスターを獲得する全プロセス Jul 17, 2024 am 01:56 AM

これも Tusheng のビデオですが、PaintsUndo は別の道を歩んでいます。 ControlNet 作者 LvminZhang が再び生き始めました!今回は絵画の分野を目指します。新しいプロジェクト PaintsUndo は、開始されて間もなく 1.4kstar を獲得しました (まだ異常なほど上昇しています)。プロジェクトアドレス: https://github.com/lllyasviel/Paints-UNDO このプロジェクトを通じて、ユーザーが静止画像を入力すると、PaintsUndo が線画から完成品までのペイントプロセス全体のビデオを自動的に生成するのに役立ちます。。描画プロセス中の線の変化は驚くべきもので、最終的なビデオ結果は元の画像と非常によく似ています。完成した描画を見てみましょう。

RLHF から DPO、TDPO に至るまで、大規模なモデルアライメントアルゴリズムはすでに「トークンレベル」になっています Jun 24, 2024 pm 03:04 PM

AIxivコラムは、当サイトが学術的・技術的な内容を掲載するコラムです。過去数年間で、このサイトの AIxiv コラムには 2,000 件を超えるレポートが寄せられ、世界中の主要な大学や企業のトップ研究室がカバーされ、学術交流と普及を効果的に促進しています。共有したい優れた作品がある場合は、お気軽に寄稿するか、報告のために当社までご連絡ください。提出メール: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com 人工知能の開発プロセスにおいて、大規模言語モデル (LLM) の制御とガイダンスは常に中心的な課題の 1 つであり、これらのモデルが両方とも確実に機能することを目指しています。強力かつ安全に人類社会に貢献します。初期の取り組みは人間のフィードバックによる強化学習手法に焦点を当てていました (RL

オープンソース AI ソフトウェアエンジニアのリストのトップに立つ UIUC のエージェントレスソリューションは、SWE ベンチの実際のプログラミングの問題を簡単に解決します Jul 17, 2024 pm 10:02 PM

AIxivコラムは、当サイトが学術的・技術的な内容を掲載するコラムです。過去数年間で、このサイトの AIxiv コラムには 2,000 件を超えるレポートが寄せられ、世界中の主要な大学や企業のトップ研究室がカバーされ、学術交流と普及を効果的に促進しています。共有したい優れた作品がある場合は、お気軽に寄稿するか、報告のために当社までご連絡ください。提出電子メール: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com この論文の著者は全員、イリノイ大学アーバナシャンペーン校 (UIUC) の Zhang Lingming 教師のチームのメンバーです。博士課程4年、研究者

OpenAI Super Alignment チームの遺作: 2 つの大きなモデルがゲームをプレイし、出力がより理解しやすくなる Jul 19, 2024 am 01:29 AM

AIモデルによって与えられた答えがまったく理解できない場合、あなたはそれをあえて使用しますか?機械学習システムがより重要な分野で使用されるにつれて、なぜその出力を信頼できるのか、またどのような場合に信頼してはいけないのかを実証することがますます重要になっています。複雑なシステムの出力に対する信頼を得る方法の 1 つは、人間または他の信頼できるシステムが読み取れる、つまり、考えられるエラーが発生する可能性がある点まで完全に理解できる、その出力の解釈を生成することをシステムに要求することです。見つかった。たとえば、司法制度に対する信頼を築くために、裁判所に対し、決定を説明し裏付ける明確で読みやすい書面による意見を提供することを求めています。大規模な言語モデルの場合も、同様のアプローチを採用できます。ただし、このアプローチを採用する場合は、言語モデルが

リーマン予想の大きな進歩!陶哲軒氏はMITとオックスフォードの新しい論文を強く推薦し、37歳のフィールズ賞受賞者も参加した Aug 05, 2024 pm 03:32 PM

最近、2000年代の7大問題の一つとして知られるリーマン予想が新たなブレークスルーを達成した。リーマン予想は、数学における非常に重要な未解決の問題であり、素数の分布の正確な性質に関連しています (素数とは、1 とそれ自身でのみ割り切れる数であり、整数論において基本的な役割を果たします)。今日の数学文献には、リーマン予想 (またはその一般化された形式) の確立に基づいた 1,000 を超える数学的命題があります。言い換えれば、リーマン予想とその一般化された形式が証明されれば、これらの 1,000 を超える命題が定理として確立され、数学の分野に重大な影響を与えることになります。これらの命題の一部も有効性を失います。 MIT数学教授ラリー・ガスとオックスフォード大学から新たな進歩がもたらされる

公理的トレーニングにより、LLM は因果推論を学習できます。6,700 万個のパラメータモデルは、1 兆個のパラメータレベル GPT-4 に匹敵します。 Jul 17, 2024 am 10:14 AM

LLM に因果連鎖を示すと、LLM は公理を学習します。 AI はすでに数学者や科学者の研究を支援しています。たとえば、有名な数学者のテレンスタオは、GPT などの AI ツールを活用した研究や探索の経験を繰り返し共有しています。 AI がこれらの分野で競争するには、強力で信頼性の高い因果推論能力が不可欠です。この記事で紹介する研究では、小さなグラフでの因果的推移性公理の実証でトレーニングされた Transformer モデルが、大きなグラフでの推移性公理に一般化できることがわかりました。言い換えれば、Transformer が単純な因果推論の実行を学習すると、より複雑な因果推論に使用できる可能性があります。チームが提案した公理的トレーニングフレームワークは、デモンストレーションのみで受動的データに基づいて因果推論を学習するための新しいパラダイムです。

arXiv 論文は「弾幕」として投稿可能、スタンフォード alphaXiv ディスカッションプラットフォームはオンライン、LeCun は気に入っています Aug 01, 2024 pm 05:18 PM

乾杯！紙面でのディスカッションが言葉だけになると、どんな感じになるでしょうか?最近、スタンフォード大学の学生が、arXiv 論文のオープンディスカッションフォーラムである alphaXiv を作成しました。このフォーラムでは、arXiv 論文に直接質問やコメントを投稿できます。 Web サイトのリンク: https://alphaxiv.org/ 実際、URL の arXiv を alphaXiv に変更するだけで、alphaXiv フォーラムの対応する論文を直接開くことができます。この Web サイトにアクセスする必要はありません。その中の段落を正確に見つけることができます。論文、文: 右側のディスカッションエリアでは、ユーザーは論文のアイデアや詳細について著者に尋ねる質問を投稿できます。たとえば、次のような論文の内容についてコメントすることもできます。

無制限のビデオ生成、計画と意思決定、次のトークン予測とフルシーケンス拡散の拡散強制統合 Jul 23, 2024 pm 02:05 PM

現在、次のトークン予測パラダイムを使用した自己回帰大規模言語モデルが世界中で普及していると同時に、インターネット上の多数の合成画像やビデオがすでに拡散モデルの威力を示しています。最近、MITCSAIL の研究チーム (そのうちの 1 人は MIT の博士課程学生、Chen Boyuan です) は、全系列拡散モデルとネクストトークンモデルの強力な機能を統合することに成功し、トレーニングおよびサンプリングパラダイムである拡散強制 (DF) を提案しました。）。論文タイトル：DiffusionForcing:Next-tokenPredictionMeetsFull-SequenceDiffusion 論文アドレス：https:/

See all articles

TRIBE はドメイン適応の堅牢性を実現し、複数の現実のシナリオで SOTA の AAAII 2024 に到達します。

ホットAIツール

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

人気の記事

ホットツール

メモ帳++7.3.1

SublimeText3 中国語版

ゼンドスタジオ 13.0.1

ドリームウィーバー CS6

SublimeText3 Mac版

ホットトピック