ICLR 2024 Oral | 時間の経過とともに変化する分布の変化に対処するために、ウェスタンオンタリオ大学などが学習時系列軌跡法を提案しました。

AIxivコラムは、本サイト上で学術的・技術的な内容を掲載するコラムです。過去数年間で、このサイトの AIxiv コラムには 2,000 件を超えるレポートが寄せられ、世界中の主要な大学や企業のトップ研究室がカバーされ、学術交流と普及を効果的に促進しています。共有したい優れた作品がある場合は、お気軽に寄稿するか、報告のために当社までご連絡ください。投稿メール: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com
著者の曾秋林はハルビン工業大学を卒業し、シンガポール国立大学で修士号を取得しました。王波教授とリン・シャオフェン学者の指導の下、博士課程では主にランダムな時間変化の分布に関する理論的実証、手法および応用研究を実施した。現在、ICLR/AAAI/IEEE TNNLS で多くの学術論文を発表しています。
個人ホームページ: https://hardworkingpearl.github.io/
現実の機械学習アプリケーションでは、時間の経過に伴う分布の変化が一般的な問題です。この状況は時変ドメイン一般化 (EDG) として枠組み化されており、その目標は、ドメイン全体で基礎となる進化するパターンを学習し、これらのパターンを活用することで、時変システム内の目に見えないターゲット ドメインまでモデルをうまく一般化できるようにすることです。ただし、EDG データセット内のタイムスタンプの数が限られているため、既存の手法では、進化するダイナミクスを捕捉し、疎なタイムスタンプへの過剰適合を回避する際に課題が発生し、その一般化と新しいタスクへの適応性が制限されます。
この問題を解決するために、我々は新しい手法 SDE-EDG を提案します。これは、過学習の問題を克服するためにサンプルを継続的に補間することによってデータ分布の無限細分割グリッド展開軌跡 (IFGET) を収集します。さらに、連続軌跡を捕捉する確率微分方程式 (SDE) の固有の能力を利用することにより、SDE によってモデル化された軌跡を最尤推定を通じて IFGET の軌跡と位置合わせし、それによって分布進化傾向の捕捉を達成することを提案します。
論文タイトル: 時間の経過に伴う分布シフト下の限定タイムスタンプの潜在軌道学習
論文リンク: https://openreview.net/pdf?id=bTMMNT7IdW
プロジェクトリンク: https: //github.com/HardworkingPearl/SDE-EDG-iclr2024
メソッド
コアアイデア
この課題を克服するために、SDE-EDG は無限セグメントを構築することによる新しいアプローチを提案しています 無限に細かいグリッドの進化軌道(IFGET) は、タイムスタンプ間のギャップを埋めるために、潜在表現空間に連続した補間サンプルを作成します。さらに、SDE-EDG は、確率微分方程式 (SDE) の固有の機能を利用して連続軌道ダイナミクスを捕捉し、パス アライメント正則化機能を通じて SDE モデル化された軌道を IFGET と整合させ、それによって進化する分布トレンドのクロスドメインの捕捉を実現します。
方法の詳細
1. IFGETの構築:
まず、SDE-EDGは潜在表現空間内の各サンプルのサンプル間の対応を確立し、個々のサンプルの進化の軌跡を収集します。時間 における各カテゴリー k の任意のサンプル
について、時間
における特徴空間内でそれに最も近い
と
における対応するサンプル
ここで、は2つのベクトル間の距離の計算であり、
は次のフィールド
からサンプリングされた
サンプルのセットです。
この対応関係は、タイムスタンプ間隔間の時間ギャップを接続し、疎なタイムスタンプへの過剰適合を回避することを目的として、連続する補間サンプルを生成するために利用されます。
ここではベータ分布からサンプリングされています。上記の方法で生成されたサンプルのタイミング トレース を収集すると、IFGET が得られます。
を通じて将来の任意の時点 のサンプルを予測できます。
は、ある時点 のサンプルから予測され、
はドリフト関数、
は拡散機能。
で、最初の項は予測分類タスクの誤差損失です。関数 。
4. 実験
次の表は、複数のデータセットにおける SDE-EDG と他のベースライン手法の間の分類精度の比較を示しています。これらのデータセットには、回転ガウス (RG)、円 (Cir)、回転 MNIST (RM)、ポートレート (Por)、Caltran (Cal)、PowerSupply (PS)、および眼疾患 (OD) が含まれます。結果は、SDE-EDG がすべてのデータセットで平均して他の手法よりも優れていることを示しています。
下の図は、SDE-EDG アルゴリズム (左) と従来の DG 手法 IRM (右) の特徴表現の違いを直感的に比較したものです。データ特徴空間の視覚化を通じて、SDE-EDG によって学習された特徴表現には明確な決定境界があり、異なるカテゴリのデータ ポイントが明確に区別され、異なる形状で表現され、異なるドメインのデータが虹の色の区別。これは、SDE-EDG が時間の経過に伴うデータ進化のダイナミクスをうまく捉え、特徴空間内のクラスの分離性を維持できることを示しています。対照的に、IRM の特徴表現はデータ ポイントを単一の方向に崩壊させる傾向があり、その結果、決定の境界が不明確になります。これは、時間変化する分布傾向の捕捉における IRM の不十分さを反映しています。
次の図は、一連の部分図を通じて、時間の経過に伴うデータの進化を捕捉する機能における SDE-EDG アルゴリズムの利点を詳しく示しています。部分図 (a) は、Sine データセットの実際のラベル分布を示しています。ここでは、正の例と負の例が異なる色の点で表され、後続の比較のベースラインとなります。次に、サブ図 (b) と (c) は、同じデータセットに対する ERM と SDE-EDG アルゴリズムに基づく従来の方法の予測結果をそれぞれ示しています。比較すると、SDE-EDG の明らかな利点がわかります。データの進化パターン。サブ図 (d) および (e) は、SDE-EDG によって学習された進化パスをさらに明らかにします。ここで、(d) はパス アライメント損失 (最尤損失関数) を適用した後のパスを示し、(e) はパス アライメント損失を適用しないパスを示します。この損失を適用します。この比較から、モデルが時間の経過に伴うデータの変化を正確に捕捉して特徴付けることを保証する上で、パス アライメントの損失が重要であることが直感的にわかります。
-
次のサブグラフ (a) は、Portraits データセットでのトレーニングにさまざまなアルゴリズムを使用した場合の精度収束軌跡を示しています。この部分図は、トレーニング中に SDE-EDG アルゴリズムのパフォーマンスが他のベースライン手法 (ERM、MLDG、GI など) とどのように変化するかを比較するための直感的な視点を提供します。時間の経過に伴うトレーニング精度の増加傾向を観察することで、さまざまなアルゴリズムの学習能力と収束速度を評価できます。 SDE-EDG アルゴリズムの収束軌跡は、進化するデータ分布に適応する際のアルゴリズムの効率と安定性を明らかにするため、特に興味深いものです。
次のサブ図 (b) と (c) は、それぞれ RMNIST と Circle データ セットを示しています。これらのデータ セットに対する SDE-EDG アルゴリズムのパフォーマンスは、面 A が高い場合でも、時変分布の処理において優れていることを示しています。また、より長い期間にわたってターゲット ドメインの精度を維持することもできます。これは、データ進化パターンを捕捉し、それに適応する際の SDE-EDG アルゴリズムの強力な能力を示しています。
次のサブ図 (d) と (e) は、RMNIST および PowerSupply データ セットでの SDE-EDG のパフォーマンスに対する最尤損失の影響を調査します。正則化の重み α の値を変更することにより、これら 2 つのサブプロットは、さまざまな α 設定がモデルのパフォーマンスに与える具体的な影響を示しています。実験結果は、適切な α 値によって特定のデータセットに対する SDE-EDG のパフォーマンスが大幅に向上することを示しており、実際のアプリケーションではデータセットの特性とタスク要件に応じてハイパーパラメーターを調整することの重要性が強調されています。
結論
この論文の著者は、時変領域一般化 (EDG) 問題をモデル化するための新しい SDE-EDG 手法を提案しました。この方法には、サンプル間の対応を特定し、連続する補間サンプルを生成することによって IFGET を構築することが含まれます。その後、著者らは確率微分方程式 (SDE) を取得し、トレーニングのために IFGET と調整しました。この記事の貢献は、個体の時間軌跡を収集し、時間間隔を補間してソース タイムスタンプの数が制限されている問題を軽減することで進化パターンを捕捉することの重要性を明らかにすることです。これにより、SDE-EDG のタイムスタンプ数が制限されるのを効果的に防ぐことができます。過学習のタイムスタンプ。
以上がICLR 2024 Oral | 時間の経過とともに変化する分布の変化に対処するために、ウェスタンオンタリオ大学などが学習時系列軌跡法を提案しました。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

Video Face Swap
完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック











これも Tusheng のビデオですが、PaintsUndo は別の道を歩んでいます。 ControlNet 作者 LvminZhang が再び生き始めました!今回は絵画の分野を目指します。新しいプロジェクト PaintsUndo は、開始されて間もなく 1.4kstar を獲得しました (まだ異常なほど上昇しています)。プロジェクトアドレス: https://github.com/lllyasviel/Paints-UNDO このプロジェクトを通じて、ユーザーが静止画像を入力すると、PaintsUndo が線画から完成品までのペイントプロセス全体のビデオを自動的に生成するのに役立ちます。 。描画プロセス中の線の変化は驚くべきもので、最終的なビデオ結果は元の画像と非常によく似ています。完成した描画を見てみましょう。

AIxivコラムは、当サイトが学術的・技術的な内容を掲載するコラムです。過去数年間で、このサイトの AIxiv コラムには 2,000 件を超えるレポートが寄せられ、世界中の主要な大学や企業のトップ研究室がカバーされ、学術交流と普及を効果的に促進しています。共有したい優れた作品がある場合は、お気軽に寄稿するか、報告のために当社までご連絡ください。提出電子メール: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com この論文の著者は全員、イリノイ大学アーバナ シャンペーン校 (UIUC) の Zhang Lingming 教師のチームのメンバーです。博士課程4年、研究者

AIxivコラムは、当サイトが学術的・技術的な内容を掲載するコラムです。過去数年間で、このサイトの AIxiv コラムには 2,000 件を超えるレポートが寄せられ、世界中の主要な大学や企業のトップ研究室がカバーされ、学術交流と普及を効果的に促進しています。共有したい優れた作品がある場合は、お気軽に寄稿するか、報告のために当社までご連絡ください。提出メール: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com 人工知能の開発プロセスにおいて、大規模言語モデル (LLM) の制御とガイダンスは常に中心的な課題の 1 つであり、これらのモデルが両方とも確実に機能することを目指しています。強力かつ安全に人類社会に貢献します。初期の取り組みは人間のフィードバックによる強化学習手法に焦点を当てていました (RL

乾杯!紙面でのディスカッションが言葉だけになると、どんな感じになるでしょうか?最近、スタンフォード大学の学生が、arXiv 論文のオープン ディスカッション フォーラムである alphaXiv を作成しました。このフォーラムでは、arXiv 論文に直接質問やコメントを投稿できます。 Web サイトのリンク: https://alphaxiv.org/ 実際、URL の arXiv を alphaXiv に変更するだけで、alphaXiv フォーラムの対応する論文を直接開くことができます。この Web サイトにアクセスする必要はありません。その中の段落を正確に見つけることができます。論文、文: 右側のディスカッション エリアでは、ユーザーは論文のアイデアや詳細について著者に尋ねる質問を投稿できます。たとえば、次のような論文の内容についてコメントすることもできます。

最近、2000年代の7大問題の一つとして知られるリーマン予想が新たなブレークスルーを達成した。リーマン予想は、数学における非常に重要な未解決の問題であり、素数の分布の正確な性質に関連しています (素数とは、1 とそれ自身でのみ割り切れる数であり、整数論において基本的な役割を果たします)。今日の数学文献には、リーマン予想 (またはその一般化された形式) の確立に基づいた 1,000 を超える数学的命題があります。言い換えれば、リーマン予想とその一般化された形式が証明されれば、これらの 1,000 を超える命題が定理として確立され、数学の分野に重大な影響を与えることになります。これらの命題の一部も有効性を失います。 MIT数学教授ラリー・ガスとオックスフォード大学から新たな進歩がもたらされる

AIモデルによって与えられた答えがまったく理解できない場合、あなたはそれをあえて使用しますか?機械学習システムがより重要な分野で使用されるにつれて、なぜその出力を信頼できるのか、またどのような場合に信頼してはいけないのかを実証することがますます重要になっています。複雑なシステムの出力に対する信頼を得る方法の 1 つは、人間または他の信頼できるシステムが読み取れる、つまり、考えられるエラーが発生する可能性がある点まで完全に理解できる、その出力の解釈を生成することをシステムに要求することです。見つかった。たとえば、司法制度に対する信頼を築くために、裁判所に対し、決定を説明し裏付ける明確で読みやすい書面による意見を提供することを求めています。大規模な言語モデルの場合も、同様のアプローチを採用できます。ただし、このアプローチを採用する場合は、言語モデルが

言語モデルは本当に時系列予測に使用できるのでしょうか?ベタリッジの見出しの法則 (疑問符で終わるニュース見出しは「いいえ」と答えることができます) によれば、答えは「いいえ」であるはずです。このような強力な LLM は時系列データを適切に処理できないという事実は真実のようです。時系列、つまり時系列とは、その名の通り、時間順に並べられた一連のデータ点のことを指します。時系列分析は、病気の蔓延予測、小売分析、ヘルスケア、金融などの多くの分野で重要です。時系列分析の分野では、多くの研究者が最近、大規模言語モデル (LLM) を使用して時系列の異常を分類、予測、検出する方法を研究しています。これらの論文では、テキスト内の逐次依存関係の処理に優れた言語モデルは時系列にも一般化できると想定しています。

AIxivコラムは、当サイトが学術的・技術的な内容を掲載するコラムです。過去数年間で、このサイトの AIxiv コラムには 2,000 件を超えるレポートが寄せられ、世界中の主要な大学や企業のトップ研究室がカバーされ、学術交流と普及を効果的に促進しています。共有したい優れた作品がある場合は、お気軽に寄稿するか、報告のために当社までご連絡ください。提出電子メール: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com。はじめに 近年、さまざまな分野でマルチモーダル大規模言語モデル (MLLM) の適用が目覚ましい成功を収めています。ただし、多くの下流タスクの基本モデルとして、現在の MLLM はよく知られた Transformer ネットワークで構成されています。
