ホームページ テクノロジー周辺機器 AI ICLR 2024 Oral | 時間の経過とともに変化する分布の変化に対処するために、ウェスタンオンタリオ大学などが学習時系列軌跡法を提案しました。

ICLR 2024 Oral | 時間の経過とともに変化する分布の変化に対処するために、ウェスタンオンタリオ大学などが学習時系列軌跡法を提案しました。

Jun 19, 2024 pm 08:45 PM
プロジェクト SDE-EDG

ICLR 2024 Oral | 应对随时间变化的分布偏移,西安大略大学等提出学习时序轨迹方法
AIxivコラムは、本サイト上で学術的・技術的な内容を掲載するコラムです。過去数年間で、このサイトの AIxiv コラムには 2,000 件を超えるレポートが寄せられ、世界中の主要な大学や企業のトップ研究室がカバーされ、学術交流と普及を効果的に促進しています。共有したい優れた作品がある場合は、お気軽に寄稿するか、報告のために当社までご連絡ください。投稿メール: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com

著者の曾秋林はハルビン工業大学を卒業し、シンガポール国立大学で修士号を取得しました。王波教授とリン・シャオフェン学者の指導の下、博士課程では主にランダムな時間変化の分布に関する理論的実証、手法および応用研究を実施した。現在、ICLR/AAAI/IEEE TNNLS で多くの学術論文を発表しています。

個人ホームページ: https://hardworkingpearl.github.io/

現実の機械学習アプリケーションでは、時間の経過に伴う分布の変化が一般的な問題です。この状況は時変ドメイン一般化 (EDG) として枠組み化されており、その目標は、ドメイン全体で基礎となる進化するパターンを学習し、これらのパターンを活用することで、時変システム内の目に見えないターゲット ドメインまでモデルをうまく一般化できるようにすることです。ただし、EDG データセット内のタイムスタンプの数が限られているため、既存の手法では、進化するダイナミクスを捕捉し、疎なタイムスタンプへの過剰適合を回避する際に課題が発生し、その一般化と新しいタスクへの適応性が制限されます。

この問題を解決するために、我々は新しい手法 SDE-EDG を提案します。これは、過学習の問題を克服するためにサンプルを継続的に補間することによってデータ分布の無限細分割グリッド展開軌跡 (IFGET) を収集します。さらに、連続軌跡を捕捉する確率微分方程式 (SDE) の固有の能力を利用することにより、SDE によってモデル化された軌跡を最尤推定を通じて IFGET の軌跡と位置合わせし、それによって分布進化傾向の捕捉を達成することを提案します。

ICLR 2024 Oral | 应对随时间变化的分布偏移,西安大略大学等提出学习时序轨迹方法

  • 論文タイトル: 時間の経過に伴う分布シフト下の限定タイムスタンプの潜在軌道学習

  • 論文リンク: https://openreview.net/pdf?id=bTMMNT7IdW

  • プロジェクトリンク: https: //github.com/HardworkingPearl/SDE-EDG-iclr2024

メソッド

コアアイデア

この課題を克服するために、SDE-EDG は無限セグメントを構築することによる新しいアプローチを提案しています 無限に細かいグリッドの進化軌道(IFGET) は、タイムスタンプ間のギャップを埋めるために、潜在表現空間に連続した補間サンプルを作成します。さらに、SDE-EDG は、確率微分方程式 (SDE) の固有の機能を利用して連続軌道ダイナミクスを捕捉し、パス アライメント正則化機能を通じて SDE モデル化された軌道を IFGET と整合させ、それによって進化する分布トレンドのクロスドメインの捕捉を実現します。

方法の詳細

1. IFGETの構築:

まず、SDE-EDGは潜在表現空間内の各サンプルのサンプル間の対応を確立し、個々のサンプルの進化の軌跡を収集します。時間 ICLR 2024 Oral | 应对随时间变化的分布偏移,西安大略大学等提出学习时序轨迹方法 における各カテゴリー k の任意のサンプル ICLR 2024 Oral | 应对随时间变化的分布偏移,西安大略大学等提出学习时序轨迹方法 について、時間 ICLR 2024 Oral | 应对随时间变化的分布偏移,西安大略大学等提出学习时序轨迹方法 における特徴空間内でそれに最も近い ICLR 2024 Oral | 应对随时间变化的分布偏移,西安大略大学等提出学习时序轨迹方法ICLR 2024 Oral | 時間の経過とともに変化する分布の変化に対処するために、ウェスタンオンタリオ大学などが学習時系列軌跡法を提案しました。 における対応するサンプル

を検索します。

ICLR 2024 Oral | 应对随时间变化的分布偏移,西安大略大学等提出学习时序轨迹方法

ここで、ICLR 2024 Oral | 应对随时间变化的分布偏移,西安大略大学等提出学习时序轨迹方法は2つのベクトル間の距離の計算であり、ICLR 2024 Oral | 应对随时间变化的分布偏移,西安大略大学等提出学习时序轨迹方法は次のフィールドICLR 2024 Oral | 应对随时间变化的分布偏移,西安大略大学等提出学习时序轨迹方法からサンプリングされたICLR 2024 Oral | 应对随时间变化的分布偏移,西安大略大学等提出学习时序轨迹方法サンプルのセットです。

この対応関係は、タイムスタンプ間隔間の時間ギャップを接続し、疎なタイムスタンプへの過剰適合を回避することを目的として、連続する補間サンプルを生成するために利用されます。

ICLR 2024 Oral | 应对随时间变化的分布偏移,西安大略大学等提出学习时序轨迹方法

ここではベータ分布からサンプリングされています。上記の方法で生成されたサンプルのタイミング トレース ICLR 2024 Oral | 应对随时间变化的分布偏移,西安大略大学等提出学习时序轨迹方法 を収集すると、IFGET が得られます。 ICLR 2024 Oral | 应对随时间变化的分布偏移,西安大略大学等提出学习时序轨迹方法

2. SDE を使用した軌跡のモデル化:

SDE-EDG は、潜在空間内のデータの連続時間軌跡をモデル化するためにニューラル SDE を採用しています。従来の離散タイムスタンプ ベースのモデルとは異なり、SDE は当然、連続時間軌跡のシミュレーションに適しています。 SDE-EDG は時系列軌跡をモデル化し、ある時点

を通じて将来の任意の時点 ICLR 2024 Oral | 時間の経過とともに変化する分布の変化に対処するために、ウェスタンオンタリオ大学などが学習時系列軌跡法を提案しました。 のサンプルを予測できます。 ICLR 2024 Oral | 应对随时间变化的分布偏移,西安大略大学等提出学习时序轨迹方法

ICLR 2024 Oral | 应对随时间变化的分布偏移,西安大略大学等提出学习时序轨迹方法

ここで、特徴空間変数

は、ある時点 ICLR 2024 Oral | 应对随时间变化的分布偏移,西安大略大学等提出学习时序轨迹方法 のサンプルから予測され、ICLR 2024 Oral | 应对随时间变化的分布偏移,西安大略大学等提出学习时序轨迹方法 はドリフト関数、ICLR 2024 Oral | 应对随时间变化的分布偏移,西安大略大学等提出学习时序轨迹方法 は拡散機能。 ICLR 2024 Oral | 应对随时间变化的分布偏移,西安大略大学等提出学习时序轨迹方法

3. パスのアライメントと最尤推定:

SDE-EDG は、IFGET の尤度推定を最大化することでモデルをトレーニングします。

ICLR 2024 Oral | 应对随时间变化的分布偏移,西安大略大学等提出学习时序轨迹方法

最後のトレーニング関数は

で、最初の項は予測分類タスクの誤差損失です。関数 。 ICLR 2024 Oral | 应对随时间变化的分布偏移,西安大略大学等提出学习时序轨迹方法

4. 実験

  • 次の表は、複数のデータセットにおける SDE-EDG と他のベースライン手法の間の分類精度の比較を示しています。これらのデータセットには、回転ガウス (RG)、円 (Cir)、回転 MNIST (RM)、ポートレート (Por)、Caltran (Cal)、PowerSupply (PS)、および眼疾患 (OD) が含まれます。結果は、SDE-EDG がすべてのデータセットで平均して他の手法よりも優れていることを示しています。

ICLR 2024 Oral | 应对随时间变化的分布偏移,西安大略大学等提出学习时序轨迹方法

  • 下の図は、SDE-EDG アルゴリズム (左) と従来の DG 手法 IRM (右) の特徴表現の違いを直感的に比較したものです。データ特徴空間の視覚化を通じて、SDE-EDG によって学習された特徴表現には明確な決定境界があり、異なるカテゴリのデータ ポイントが明確に区別され、異なる形状で表現され、異なるドメインのデータが虹の色の区別。これは、SDE-EDG が時間の経過に伴うデータ進化のダイナミクスをうまく捉え、特徴空間内のクラスの分離性を維持できることを示しています。対照的に、IRM の特徴表現はデータ ポイントを単一の方向に崩壊させる傾向があり、その結果、決定の境界が不明確になります。これは、時間変化する分布傾向の捕捉における IRM の不十分さを反映しています。

ICLR 2024 Oral | 应对随时间变化的分布偏移,西安大略大学等提出学习时序轨迹方法

  • 次の図は、一連の部分図を通じて、時間の経過に伴うデータの進化を捕捉する機能における SDE-EDG アルゴリズムの利点を詳しく示しています。部分図 (a) は、Sine データセットの実際のラベル分布を示しています。ここでは、正の例と負の例が異なる色の点で表され、後続の比較のベースラインとなります。次に、サブ図 (b) と (c) は、同じデータセットに対する ERM と SDE-EDG アルゴリズムに基づく従来の方法の予測結果をそれぞれ示しています。比較すると、SDE-EDG の明らかな利点がわかります。データの進化パターン。サブ図 (d) および (e) は、SDE-EDG によって学習された進化パスをさらに明らかにします。ここで、(d) はパス アライメント損失 (最尤損失関数) を適用した後のパスを示し、(e) はパス アライメント損失を適用しないパスを示します。この損失を適用します。この比較から、モデルが時間の経過に伴うデータの変化を正確に捕捉して特徴付けることを保証する上で、パス アライメントの損失が重要であることが直感的にわかります。

ICLR 2024 Oral | 应对随时间变化的分布偏移,西安大略大学等提出学习时序轨迹方法

  • 次のサブグラフ (a) は、Portraits データセットでのトレーニングにさまざまなアルゴリズムを使用した場合の精度収束軌跡を示しています。この部分図は、トレーニング中に SDE-EDG アルゴリズムのパフォーマンスが他のベースライン手法 (ERM、MLDG、GI など) とどのように変化するかを比較するための直感的な視点を提供します。時間の経過に伴うトレーニング精度の増加傾向を観察することで、さまざまなアルゴリズムの学習能力と収束速度を評価できます。 SDE-EDG アルゴリズムの収束軌跡は、進化するデータ分布に適応する際のアルゴリズムの効率と安定性を明らかにするため、特に興味深いものです。

    次のサブ図 (b) と (c) は、それぞれ RMNIST と Circle データ セットを示しています。これらのデータ セットに対する SDE-EDG アルゴリズムのパフォーマンスは、面 A が高い場合でも、時変分布の処理において優れていることを示しています。また、より長い期間にわたってターゲット ドメインの精度を維持することもできます。これは、データ進化パターンを捕捉し、それに適応する際の SDE-EDG アルゴリズムの強力な能力を示しています。

    次のサブ図 (d) と (e) は、RMNIST および PowerSupply データ セットでの SDE-EDG のパフォーマンスに対する最尤損失の影響を調査します。正則化の重み α の値を変更することにより、これら 2 つのサブプロットは、さまざまな α 設定がモデルのパフォーマンスに与える具体的な影響を示しています。実験結果は、適切な α 値によって特定のデータセットに対する SDE-EDG のパフォーマンスが大幅に向上することを示しており、実際のアプリケーションではデータセットの特性とタスク要件に応じてハイパーパラメーターを調整することの重要性が強調されています。

ICLR 2024 Oral | 应对随时间变化的分布偏移,西安大略大学等提出学习时序轨迹方法

結論

この論文の著者は、時変領域一般化 (EDG) 問題をモデル化するための新しい SDE-EDG 手法を提案しました。この方法には、サンプル間の対応を特定し、連続する補間サンプルを生成することによって IFGET を構築することが含まれます。その後、著者らは確率微分方程式 (SDE) を取得し、トレーニングのために IFGET と調整しました。この記事の貢献は、個体の時間軌跡を収集し、時間間隔を補間してソース タイムスタンプの数が制限されている問題を軽減することで進化パターンを捕捉することの重要性を明らかにすることです。これにより、SDE-EDG のタイムスタンプ数が制限されるのを効果的に防ぐことができます。過学習のタイムスタンプ。

以上がICLR 2024 Oral | 時間の経過とともに変化する分布の変化に対処するために、ウェスタンオンタリオ大学などが学習時系列軌跡法を提案しました。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

Video Face Swap

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

ControlNet の作者がまたヒット作を出しました!写真から絵画を生成し、2 日間で 1.4,000 個のスターを獲得する全プロセス ControlNet の作者がまたヒット作を出しました!写真から絵画を生成し、2 日間で 1.4,000 個のスターを獲得する全プロセス Jul 17, 2024 am 01:56 AM

これも Tusheng のビデオですが、PaintsUndo は別の道を歩んでいます。 ControlNet 作者 LvminZhang が再び生き始めました!今回は絵画の分野を目指します。新しいプロジェクト PaintsUndo は、開始されて間もなく 1.4kstar を獲得しました (まだ異常なほど上昇しています)。プロジェクトアドレス: https://github.com/lllyasviel/Paints-UNDO このプロジェクトを通じて、ユーザーが静止画像を入力すると、PaintsUndo が線画から完成品までのペイントプロセス全体のビデオを自動的に生成するのに役立ちます。 。描画プロセス中の線の変化は驚くべきもので、最終的なビデオ結果は元の画像と非常によく似ています。完成した描画を見てみましょう。

オープンソース AI ソフトウェア エンジニアのリストのトップに立つ UIUC のエージェントレス ソリューションは、SWE ベンチの実際のプログラミングの問題を簡単に解決します オープンソース AI ソフトウェア エンジニアのリストのトップに立つ UIUC のエージェントレス ソリューションは、SWE ベンチの実際のプログラミングの問題を簡単に解決します Jul 17, 2024 pm 10:02 PM

AIxivコラムは、当サイトが学術的・技術的な内容を掲載するコラムです。過去数年間で、このサイトの AIxiv コラムには 2,000 件を超えるレポートが寄せられ、世界中の主要な大学や企業のトップ研究室がカバーされ、学術交流と普及を効果的に促進しています。共有したい優れた作品がある場合は、お気軽に寄稿するか、報告のために当社までご連絡ください。提出電子メール: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com この論文の著者は全員、イリノイ大学アーバナ シャンペーン校 (UIUC) の Zhang Lingming 教師のチームのメンバーです。博士課程4年、研究者

RLHF から DPO、TDPO に至るまで、大規模なモデル アライメント アルゴリズムはすでに「トークンレベル」になっています RLHF から DPO、TDPO に至るまで、大規模なモデル アライメント アルゴリズムはすでに「トークンレベル」になっています Jun 24, 2024 pm 03:04 PM

AIxivコラムは、当サイトが学術的・技術的な内容を掲載するコラムです。過去数年間で、このサイトの AIxiv コラムには 2,000 件を超えるレポートが寄せられ、世界中の主要な大学や企業のトップ研究室がカバーされ、学術交流と普及を効果的に促進しています。共有したい優れた作品がある場合は、お気軽に寄稿するか、報告のために当社までご連絡ください。提出メール: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com 人工知能の開発プロセスにおいて、大規模言語モデル (LLM) の制御とガイダンスは常に中心的な課題の 1 つであり、これらのモデルが両方とも確実に機能することを目指しています。強力かつ安全に人類社会に貢献します。初期の取り組みは人間のフィードバックによる強化学習手法に焦点を当てていました (RL

arXiv 論文は「弾幕」として投稿可能、スタンフォード alphaXiv ディスカッション プラットフォームはオンライン、LeCun は気に入っています arXiv 論文は「弾幕」として投稿可能、スタンフォード alphaXiv ディスカッション プラットフォームはオンライン、LeCun は気に入っています Aug 01, 2024 pm 05:18 PM

乾杯!紙面でのディスカッションが言葉だけになると、どんな感じになるでしょうか?最近、スタンフォード大学の学生が、arXiv 論文のオープン ディスカッション フォーラムである alphaXiv を作成しました。このフォーラムでは、arXiv 論文に直接質問やコメントを投稿できます。 Web サイトのリンク: https://alphaxiv.org/ 実際、URL の arXiv を alphaXiv に変更するだけで、alphaXiv フォーラムの対応する論文を直接開くことができます。この Web サイトにアクセスする必要はありません。その中の段落を正確に見つけることができます。論文、文: 右側のディスカッション エリアでは、ユーザーは論文のアイデアや詳細について著者に尋ねる質問を投稿できます。たとえば、次のような論文の内容についてコメントすることもできます。

リーマン予想の大きな進歩!陶哲軒氏はMITとオックスフォードの新しい論文を強く推薦し、37歳のフィールズ賞受賞者も参加した リーマン予想の大きな進歩!陶哲軒氏はMITとオックスフォードの新しい論文を強く推薦し、37歳のフィールズ賞受賞者も参加した Aug 05, 2024 pm 03:32 PM

最近、2000年代の7大問題の一つとして知られるリーマン予想が新たなブレークスルーを達成した。リーマン予想は、数学における非常に重要な未解決の問題であり、素数の分布の正確な性質に関連しています (素数とは、1 とそれ自身でのみ割り切れる数であり、整数論において基本的な役割を果たします)。今日の数学文献には、リーマン予想 (またはその一般化された形式) の確立に基づいた 1,000 を超える数学的命題があります。言い換えれば、リーマン予想とその一般化された形式が証明されれば、これらの 1,000 を超える命題が定理として確立され、数学の分野に重大な影響を与えることになります。これらの命題の一部も有効性を失います。 MIT数学教授ラリー・ガスとオックスフォード大学から新たな進歩がもたらされる

OpenAI Super Alignment チームの遺作: 2 つの大きなモデルがゲームをプレイし、出力がより理解しやすくなる OpenAI Super Alignment チームの遺作: 2 つの大きなモデルがゲームをプレイし、出力がより理解しやすくなる Jul 19, 2024 am 01:29 AM

AIモデルによって与えられた答えがまったく理解できない場合、あなたはそれをあえて使用しますか?機械学習システムがより重要な分野で使用されるにつれて、なぜその出力を信頼できるのか、またどのような場合に信頼してはいけないのかを実証することがますます重要になっています。複雑なシステムの出力に対する信頼を得る方法の 1 つは、人間または他の信頼できるシステムが読み取れる、つまり、考えられるエラーが発生する可能性がある点まで完全に理解できる、その出力の解釈を生成することをシステムに要求することです。見つかった。たとえば、司法制度に対する信頼を築くために、裁判所に対し、決定を説明し裏付ける明確で読みやすい書面による意見を提供することを求めています。大規模な言語モデルの場合も、同様のアプローチを採用できます。ただし、このアプローチを採用する場合は、言語モデルが

LLM は時系列予測にはあまり適していません。推論機能も使用しません。 LLM は時系列予測にはあまり適していません。推論機能も使用しません。 Jul 15, 2024 pm 03:59 PM

言語モデルは本当に時系列予測に使用できるのでしょうか?ベタリッジの見出しの法則 (疑問符で終わるニュース見出しは「いいえ」と答えることができます) によれば、答えは「いいえ」であるはずです。このような強力な LLM は時系列データを適切に処理できないという事実は真実のようです。時系列、つまり時系列とは、その名の通り、時間順に並べられた一連のデータ点のことを指します。時系列分析は、病気の蔓延予測、小売分析、ヘルスケア、金融などの多くの分野で重要です。時系列分析の分野では、多くの研究者が最近、大規模言語モデル (LLM) を使用して時系列の異常を分類、予測、検出する方法を研究しています。これらの論文では、テキスト内の逐次依存関係の処理に優れた言語モデルは時系列にも一般化できると想定しています。

最初の Mamba ベースの MLLM が登場しました!モデルの重み、トレーニング コードなどはすべてオープンソースです 最初の Mamba ベースの MLLM が登場しました!モデルの重み、トレーニング コードなどはすべてオープンソースです Jul 17, 2024 am 02:46 AM

AIxivコラムは、当サイトが学術的・技術的な内容を掲載するコラムです。過去数年間で、このサイトの AIxiv コラムには 2,000 件を超えるレポートが寄せられ、世界中の主要な大学や企業のトップ研究室がカバーされ、学術交流と普及を効果的に促進しています。共有したい優れた作品がある場合は、お気軽に寄稿するか、報告のために当社までご連絡ください。提出電子メール: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com。はじめに 近年、さまざまな分野でマルチモーダル大規模言語モデル (MLLM) の適用が目覚ましい成功を収めています。ただし、多くの下流タスクの基本モデルとして、現在の MLLM はよく知られた Transformer ネットワークで構成されています。

See all articles