ワークショップホームページ: https://www.php.cn/link/f73850aa36d8564629a0d62c51009acf
概要
このセミナーは、現在の最先端の自動運転技術と、それらの間の包括的で信頼性の高いインテリジェント自動運転のギャップについて議論することを目的としています。エージェント。近年、大規模なマルチモーダル モデル (GPT-4V など) は、マルチモーダルの認識と理解において前例のない進歩を示しています。 MLLM を使用して自動運転の複雑なシナリオ、特に稀ではあるが重大なハードケース シナリオに対処することは、未解決の課題です。このワークショップは、マルチモーダル大規模モデルの認識と理解、自動運転システムにおける高度な AIGC テクノロジーの応用、およびエンドツーエンドの自動運転における革新的な研究を促進することを目的としています。
ワークショップ論文募集
この草案論文は、自動運転シーンのマルチモーダル認識と理解、自動運転シーンの画像とビデオ生成、エンドツーエンドの自動運転、および次のようなトピックに焦点を当てています。 - 世代の産業グレードの自動運転ソリューション:
提出ルール:
この提出は OpenReview による二重盲検審査の対象となります
提出入り口:
自律性の難しい例運転シーンのマルチモーダル理解とビデオ生成チャレンジ
このコンテストは、マルチモーダル モデルによる自動運転における極限状況の認識と理解を向上させ、これらの極限状況を描写する能力を育成することを目的としています。豪華な賞品とボーナスをご用意しておりますので、ぜひご参加ください。トラック 1: 困難な自動運転シナリオの認識と理解
このトラックは、全体的なシーンの理解、地域の理解、機能など、困難な自動運転シナリオにおけるマルチモーダル大規模モデル (MLLM) の認識と理解能力に焦点を当てています。運転の推奨事項などは、より信頼性が高く説明可能な自動運転エージェントの開発を促進するように設計されています。トラック 2: 困難な自動運転シナリオのビデオ生成
このトラックは、マルチビューの自動運転シーンのビデオを生成する拡散モデルの機能に焦点を当てています。モデルは、自動運転シーンの指定された 3D 幾何学的構造に基づいて、対応する自動運転シーンのビデオを生成し、タイミングの一貫性、マルチビューの一貫性、指定された解像度、およびビデオの長さを保証する必要があります。競技期間: 2024年6月15日から2024年8月15日まで
賞金設定: チャンピオン1,000ドル、準優勝800ドル、3位600ドル(トラックごと)
Timeノード( AoE時間、UTC-12)
論文全文提出 | ||
論文全文提出期限 | 1 st 8月、2024年 |
|
著者へのフルペーパー通知 | 10 2024年8月 |
|
フルペーパーカメラの準備完了 | 15 | th 2024 年 8 月
|
抄録論文提出期限 |
1st2024年9月 |
|
著者への抄録論文通知 | 7th2024年9月 |
|
抽象的な紙カメラの準備完了期限 |
2024年9月10th |
|
チャレンジ | ||
チャレンジ一般公開 |
15th Jun勝者へのチャレンジ通知、2024 |
|
st | Sep, 2024ワークショップ(半日) |
|
th | Sep, 2024お問い合わせ私たち | ワークショップとチャレンジについてご質問がある場合は、|
以上がECCV 2024 ワークショップ 自動運転のマルチモーダル理解とビデオ生成 難しいシナリオの論文募集とチャレンジが開始されました!の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。