大規模モデルと具体化されたインテリジェンスの火花、ICML 2024 MFM-EAI ワークショップの論文募集とチャレンジが開始
概要
近年、CLIP、ImageBind、DALL・Eなどのマルチモーダル基本モデル(MFM)が注目されています。 3. GPT-4V、Gemini、Sora は、人工知能の分野で最も注目を集め、急速に発展している分野の 1 つとなっています。同時に、LLaVA、LAMM、MiniGPT-4、Stable Diffusion、OpenSora などの代表的なオープンソース プロジェクトによる MFM オープンソース コミュニティも出現しました。
従来のコンピューター ビジョンや自然言語処理モデルとは異なり、このタイプの MFM は一般的な問題の解決策を積極的に模索しています。 MFM を導入することにより、エンボディド インテリジェンス (EAI) は、シミュレータや現実世界の環境でさまざまな複雑なタスクをより適切に処理できるようになります。ただし、MFM と EAI の交差点には、エージェントの長期的な意思決定、エージェントの動作計画、新しい環境の一般化機能など、まだ検討および解決されていない多くの問題がまだあります。
このワークショップは、
- MFMの一般化能力、
- 生成モデルに基づく世界モデル、
- 模倣学習データ収集など、いくつかの重要な問題を探ることに専念します。
- ワークショップ論文募集
このワークショップは、マルチモーダル基本モデル (MFM)、身体性知能 (EAI)、および 2 つの研究の共通点に焦点を当てています。この論文募集のトピックには以下が含まれますが、これらに限定されません:
オープンエンドシナリオでのMFMのトレーニングと評価
- 身体化エージェントをトレーニングするためのデータ収集
- MFMを利用した身体化エージェントのためのフレームワーク設計
- 知覚と高MFM によって権限を与えられた身体化エージェントでのレベル計画
- MFM によって権限を与えられた身体化エージェントでの意思決定と低レベルの制御
- 身体化エージェントの能力の評価
- 世界シミュレータとしての生成モデル
- EAI を強化する際の MFM の限界
- 投稿ルール
この投稿は OpenReview プラットフォームを通じて二重盲検審査の対象となります。応募作品の本文は4ページまでとし、参考文献や補足資料の長さの制限はありません。
提出フォーマットとテンプレートは、ICML 2024 提出ガイドラインに従います: https://icml.cc/Conferences/2024/CallForPapers
- 提出入り口: https://openreview.net/group?id=ICML.cc/2024 /Workshop /MFM-EAI
- タイムノード
すべてのタイムノードは[AoE](地球上のどこでも)です。
MFM-EAI チャレンジ
EgoPlan チャレンジ
- EgoPlan Challenge は、現実世界のシナリオでマルチモーダルな大規模モデルを評価するように設計されています。ターゲティング 人間の日常的な活動に関わる現実世界のタスクを計画する能力。モデルは、タスクの目標の説明、一人称視点のビデオ、現在の環境の観察に基づいて、タスクを完了するための合理的なアクションを選択する必要があります。
コンテスト公式サイト:https://chenyi99.github.io/ego_plan_challenge/
- 登録方法:[Googleフォーム](https://docs.google.com/forms/d/e/1FAIpQLScnWoXjZcwaagozP3jXnzdSEXX3r2tgXbqO6JWP_lr_fd)に記入してくださいnpQw /viewform? usp =sf_link)
- 登録期間: 今から 2024 年 7 月 1 日まで
- 賞品設定:
-
優勝者: $800
- 準優勝者: $600
- イノベーション賞: $600
- コンポーザブル汎化エージェント チャレンジは、オープン シナリオでの計画と実行を組み合わせたシステムのタスク機能と汎化機能を評価することを目的としています。モデルは言語タスクの記述とマルチモーダル視覚入力に基づいてタスク分解を実行し、コントローラーは分解されたサブタスクを実行します。
詳細は 7 月に発表されます
- ワールド モデル チャレンジは、身体化されたインテリジェンス シナリオにおけるワールド シミュレーターのアプリケーション パフォーマンスを評価することを目的としています。このモデルは、具体化されたタスクの説明とリアルタイムのシーン観察に基づいてタスクの指示に従うビデオを生成し、ビデオ生成の品質とエージェントがタスクを完了するようにガイドする能力を評価します。
詳細は7月に発表します
- 委員会メンバー
ワークショップ主催者
運営委員会
以上が大規模モデルと具体化されたインテリジェンスの火花、ICML 2024 MFM-EAI ワークショップの論文募集とチャレンジが開始の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック











DeepMind ロボットが卓球をすると、フォアハンドとバックハンドが空中に滑り出し、人間の初心者を完全に打ち負かしました

クロードも怠け者になってしまった!ネチズン: 自分に休日を与える方法を学びましょう

初のメカニカルクロー!元羅宝は2024年の世界ロボット会議に登場し、家庭に入ることができる初のチェスロボットを発表した

世界ロボット会議で「未来の高齢者介護の希望」を担う家庭用ロボットを囲みました

Li Feifei 氏のチームは、ロボットに空間知能を与え、GPT-4o を統合する ReKep を提案しました

ACL 2024 賞の発表: HuaTech による Oracle 解読に関する最優秀論文の 1 つ、GloVe Time Test Award

宏蒙スマートトラベルS9とフルシナリオ新製品発売カンファレンス、多数の大ヒット新製品が一緒にリリースされました

中国初の大型UIモデル登場! Motiff の大規模モデルはデザイナーにとって最適なアシスタントを作成し、UI デザインのワークフローを最適化します
