2024年国際自動運転チャレンジが正式にスタート
- 新しいコンテストのトピック: 7 つのトラック、斬新なコンテストのトピック、関連分野の最新かつ最もホットなトピックを包括的にカバーし、垂直分野における大規模モデルの応用を完全に探索します。自動運転と身体化されたインテリジェンス アプリケーション。
- 高額賞金: 賞金総額は 120,000 米ドルを超え、1 曲あたりの最高賞金は 27,000 米ドルに達する場合があります。不完全な統計によると、報酬額は CVPR 2024 の 100 フォーラムの中で最高額です。
- 独自性の重視:基礎研究と探究を強化し、4つの側面を堅持します。オリジナリティや科学的研究の価値が主な測定指標として使用されており、ランキングはパフォーマンスのみに基づいているわけではありません。独自のソリューションと性能指標を組み合わせて総合ランキングを実施。
2024 年 3 月 1 日、2024 年国際自動運転チャレンジが正式に開始されました。このチャレンジは上海人工知能研究所が主催し、国内外の多くの機関が共催しています。国内外の数多くの著名な専門家や学者が競技指導・表彰委員会を構成しています。このコンテストは、自律システムが直面するタスクと課題を徹底的に調査し、世界中の参加者がテクノロジーとイノベーションを披露する舞台を提供することを目的としています。本大会では、同一団体の複数チームの参加、全ての公開データセットと事前トレーニングウェイトの使用、1チームのみの参加など、参加者にあまり制限を設けておりません。複数の賞を同時に受賞する。このコンテストには 7 つのトラックがあり、優勝者には最大 27,000 米ドルの賞金が与えられるほか、一流の国際ジャーナルに論文を投稿するよう招待される機会もあります。また、各トラックの詳細な競技ガイドラインとベンチマーク モデルも用意しており、各トラックの対応するリンクをクリックしてアクセスできます。
コンテストの公式 Web サイト:
https://opendrivelab.com/challenge2024
主な活動:
CVPR 2024フォーラム-自律システムの基盤モデルに関するワークショップ (米国シアトル)
関連イベント:
- 4 月下旬: 第 3 回中国 3D ビジョン カンファレンス( China3DV 2024)
- http://www.csig3dv.net/2024/competition.html
- 6 月中旬: オフライン アクティビティ (北京/上海)
コンテストのテーマの紹介エンドツーエンドの自動運転
期限以前のデータセットのサイズに制限され、一貫性のない開ループおよび閉ループのメトリクスにより、実際のデータを使用して感覚運動主導の戦略をベンチマークすることが困難になります。このトラックでは、2 つの評価パラダイム間のギャップを埋めるために大規模データが使用され、短期間の BEV 抽象モデリングを通じて、閉ループ評価との整合性を高めながら、効率的な開ループ評価が達成されます。
- トラック情報: https://www.php.cn/link/492f948808daf55a3f9e7ddd3694f546#end_to_end_driving_at_scale
- データ量: 約 2T
- テストサーバー: https: / /huggingface.co/spaces/AGC2024-P/e2e-driving-2024
世界モデル
現実の抽象的な時空間表現として、ワールド モデルは、観察された現在の状態に基づいて将来の状態を予測することができ、ワールド モデルを学習することで、基本モデルのパフォーマンスが新たなレベルに引き上げられます。モデルは、世界を予測する能力を証明するために、視覚的な入力のみを使用して将来の点群を予測する必要があります。
- トラック情報: https://www.php.cn/link/492f948808daf55a3f9e7ddd3694f546#predictive_world_model
- データ量: 約 2T
- 参考トレーニング時間: サンプルデータ、8 カード A100、3 日間
- テスト サーバー: https://huggingface.co/spaces/AGC2024-P/predictive-world-model-2024
占有グリッドと動き推定
3 次元のボックスは、一般的なオブジェクトを説明するには不十分なことがよくあります。ロボット工学の概念に触発された知覚表現は、グリッド化された 3 次元空間の占有として説明できます。 。 予測する。このトラックでは、出場者は 3 次元空間のラスター表現を提供するだけでなく、ラスターの動きを予測する必要があります。
- トラック情報: https://www.php.cn/link/492f948808daf55a3f9e7ddd3694f546#occupancy_and_flow
- 自動運転チャレンジ @China3DV: https://huggingface.co/spaces /China3DV -S/occupancy-and-flow-2024
- データ量:約 70GB
- 参考トレーニング時間:8 カード 3090、2 日間
- テスト サーバー: https:/// hackgingface.co/spaces/AGC2024-S/occupancy-and-flow-2024
マルチモーダルな 3 次元視覚的位置決めの具体化
運転シーンと比較して、屋内の具体化された 3 次元認識システムは、言語指示、より複雑な意味の理解、より多様なオブジェクト カテゴリと方向、および非常に異なる認識空間を含むマルチモーダル入力とニーズに直面しています。これに基づいて、コンペティションは、第一視点のマルチモーダルフルシーン 3 次元認識ツールキット EmbodiedScan を構築しました。このタスクの目標は、特定のオブジェクトについて口頭で説明された場合に、ターゲット オブジェクトのカテゴリとその方向を向いた 3 次元ボックスを検出することです。
- トラック情報: https://www.php.cn/link/492f948808daf55a3f9e7ddd3694f546#multiview_3d_visual_grounding
- データ量: 約 1.5T
- 参考トレーニング時間: サンプルデータ 8 カード A100 0.5 日、フルデータ 8 カード A100 3 日
- テスト サーバー: https://huggingface.co/spaces/AGC2024/visual-grounding-2024
CARLA 自動運転チャレンジ
CARLA 自動運転チャレンジでは、車両が事前に定義された一連のルートを走行する必要があります。車両の走行ルートには、高速道路、都市部、住宅地、田園環境などの複雑な状況が含まれ、日光、日没、夜間、雨、霧、その他の光や気象条件も含まれるため、閉ループ評価が可能です。自動運転システムのこと。
- トラック情報: https://www.php.cn/link/492f948808daf55a3f9e7ddd3694f546#carla
- テストサーバー: https://eval.ai/web/challenges/challenge - page/2098/overview
自動運転における大規模言語モデルの適用
言語情報を導入することで、DriveLMデータセットは大規模な言語モデルを自動運転システムに接続し、言語推論機能を導入することで最終的に意思決定を行い、計画の解釈可能性を確保します。モデルは多視点画像を入力情報として受け取り、運転に関するさまざまな質問に答える必要があります。
- トラック情報: https://www.php.cn/link/492f948808daf55a3f9e7ddd3694f546#driving_with_ language
- データ量: トレーニング セット 4072 フレーム、テスト セット 799 フレーム、各フレームは約90 の質問と回答のペア
- 参考トレーニング時間: 8 カード V100、1 日
- テスト サーバー: https://huggingface.co/spaces/AGC2024/driving-with- language-2024
地図なしでの運転
高解像度の地図がない場合、自動運転車には高度な状況理解が必要です。 track は、シナリオ推論機能の限界を探求するように設計されています。ニューラル ネットワークは、多視点画像と標準解像度の地図を入力情報として、車線と交通要素の認識結果を出力するだけでなく、車線間、および車線と交通要素間の位相関係も出力する必要があります。
- トラック情報: https://www.php.cn/link/492f948808daf55a3f9e7ddd3694f546#mapless_driving
- 自動運転チャレンジ @China3DV: https://huggingface.co/spaces /China3DV /mapless-driving-2024
- データ量: 約 200G
- 参考トレーニング時間: V100 8 枚、1 日
- テストサーバー: https://huggingface. co/ space/AGC2024/mapless-driving-2024
スケジュール
以下の時間はすべて北京時間です。公式ウェブサイトを参照してください。コンテストの詳細については、
- 今後 - 2024 年 6 月 1 日: 登録
- 2024 年 3 月 1 日: コンテストが正式に始まります
- 2024 年 3 月 25 日: テスト サーバーがオープンしました
- # 2024 年 6 月 1 日: テスト サーバーが閉鎖されました #6 月 18 日2024:
- コンテスト結果発表
名前の画数ごとに分類されており、リストは継続的に更新されています。
上海人工知能研究所 | リーダー科学者、所長補佐 | |
南京郵電大学 | 副学長 | |
上海交通大学 | # 人工知能研究所所長 | |
清華大学 | 車両大学党委員会書記、国家ハイレベルの優秀な人材、教授 |
|
張亜琴 |
清華大学 |
中国工程院外国人学者、知能産業研究所所長、教授 |
Chen Baoquan |
北京大学 |
情報学部副学部長、Boya 特別教授 |
夏華夏 |
美団 |
主任研究者、副社長 |
##高新波 | 重慶郵政大学 | 副書記党委員会委員長、教授 |
##西安交通大学 | #教授 |
https://opendrivelab.com/challenge2024
私たちについて -> コミュニティに参加する
登録リンク
##連絡先メールアドレス
workshop-e2e-ad@googlegroups.com
以上が2024年国際自動運転チャレンジが正式にスタートの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック











でももしかしたら公園の老人には勝てないかもしれない?パリオリンピックの真っ最中で、卓球が注目を集めています。同時に、ロボットは卓球のプレーにも新たな進歩をもたらしました。先ほど、DeepMind は、卓球競技において人間のアマチュア選手のレベルに到達できる初の学習ロボット エージェントを提案しました。論文のアドレス: https://arxiv.org/pdf/2408.03906 DeepMind ロボットは卓球でどれくらい優れていますか?おそらく人間のアマチュアプレーヤーと同等です: フォアハンドとバックハンドの両方: 相手はさまざまなプレースタイルを使用しますが、ロボットもそれに耐えることができます: さまざまなスピンでサーブを受ける: ただし、ゲームの激しさはそれほど激しくないようです公園の老人。ロボット、卓球用

もうすぐ学校が始まり、新学期を迎える生徒だけでなく、大型AIモデルも気を付けなければなりません。少し前、レディットはクロードが怠け者になったと不満を漏らすネチズンでいっぱいだった。 「レベルが大幅に低下し、頻繁に停止し、出力も非常に短くなりました。リリースの最初の週は、4 ページの文書全体を一度に翻訳できましたが、今では 0.5 ページの出力さえできません」 !」 https://www.reddit.com/r/ClaudeAI/comments/1by8rw8/something_just_feels_wrong_with_claude_in_the/ というタイトルの投稿で、「クロードには完全に失望しました」という内容でいっぱいだった。

8月21日、2024年世界ロボット会議が北京で盛大に開催された。 SenseTimeのホームロボットブランド「Yuanluobot SenseRobot」は、全製品ファミリーを発表し、最近、世界初の家庭用チェスロボットとなるYuanluobot AIチェスプレイロボット - Chess Professional Edition(以下、「Yuanluobot SenseRobot」という)をリリースした。家。 Yuanluobo の 3 番目のチェス対局ロボット製品である新しい Guxiang ロボットは、AI およびエンジニアリング機械において多くの特別な技術アップグレードと革新を経て、初めて 3 次元のチェスの駒を拾う機能を実現しました。家庭用ロボットの機械的な爪を通して、チェスの対局、全員でのチェスの対局、記譜のレビューなどの人間と機械の機能を実行します。

北京で開催中の世界ロボット会議では、人型ロボットの展示が絶対的な注目となっているスターダストインテリジェントのブースでは、AIロボットアシスタントS1がダルシマー、武道、書道の3大パフォーマンスを披露した。文武両道を備えた 1 つの展示エリアには、多くの専門的な聴衆とメディアが集まりました。弾性ストリングのエレガントな演奏により、S1 は、スピード、強さ、正確さを備えた繊細な操作と絶対的なコントロールを発揮します。 CCTVニュースは、「書道」の背後にある模倣学習とインテリジェント制御に関する特別レポートを実施し、同社の創設者ライ・ジエ氏は、滑らかな動きの背後にあるハードウェア側が最高の力制御と最も人間らしい身体指標(速度、負荷)を追求していると説明した。など)、AI側では人の実際の動きのデータが収集され、強い状況に遭遇したときにロボットがより強くなり、急速に進化することを学習することができます。そしてアジャイル

ビジョンとロボット学習の緊密な統合。最近話題の1X人型ロボットNEOと合わせて、2つのロボットハンドがスムーズに連携して服をたたむ、お茶を入れる、靴を詰めるといった動作をしていると、いよいよロボットの時代が到来するのではないかと感じられるかもしれません。実際、これらの滑らかな動きは、高度なロボット技術 + 精緻なフレーム設計 + マルチモーダル大型モデルの成果です。有用なロボットは多くの場合、環境との複雑かつ絶妙な相互作用を必要とし、環境は空間領域および時間領域の制約として表現できることがわかっています。たとえば、ロボットにお茶を注いでもらいたい場合、ロボットはまずティーポットのハンドルを掴んで、お茶をこぼさないように垂直に保ち、次にポットの口がカップの口と揃うまでスムーズに動かす必要があります。 、そしてティーポットを一定の角度に傾けます。これ

貢献者はこの ACL カンファレンスから多くのことを学びました。 6日間のACL2024がタイのバンコクで開催されています。 ACL は、計算言語学と自然言語処理の分野におけるトップの国際会議で、国際計算言語学協会が主催し、毎年開催されます。 ACL は NLP 分野における学術的影響力において常に第一位にランクされており、CCF-A 推奨会議でもあります。今年の ACL カンファレンスは 62 回目であり、NLP 分野における 400 以上の最先端の作品が寄せられました。昨日の午後、カンファレンスは最優秀論文およびその他の賞を発表しました。今回の優秀論文賞は7件(未発表2件)、最優秀テーマ論文賞1件、優秀論文賞35件です。このカンファレンスでは、3 つの Resource Paper Award (ResourceAward) と Social Impact Award (

今日の午後、Hongmeng Zhixingは新しいブランドと新車を正式に歓迎しました。 8月6日、ファーウェイはHongmeng Smart Xingxing S9およびファーウェイのフルシナリオ新製品発表カンファレンスを開催し、パノラマスマートフラッグシップセダンXiangjie S9、新しいM7ProおよびHuawei novaFlip、MatePad Pro 12.2インチ、新しいMatePad Air、Huawei Bisheng Withを発表しました。レーザー プリンタ X1 シリーズ、FreeBuds6i、WATCHFIT3、スマート スクリーン S5Pro など、スマート トラベル、スマート オフィスからスマート ウェアに至るまで、多くの新しいオールシナリオ スマート製品を開発し、ファーウェイは消費者にスマートな体験を提供するフル シナリオのスマート エコシステムを構築し続けています。すべてのインターネット。宏孟志興氏:スマートカー業界のアップグレードを促進するための徹底的な権限付与 ファーウェイは中国の自動車業界パートナーと提携して、

人工知能は想像を超えるスピードで発展しています。 GPT-4 がマルチモーダル技術を一般に公開して以来、マルチモーダル大型モデルは急速な開発段階に入り、純粋なモデルの研究開発から垂直分野での探査と応用へと徐々に移行し、あらゆる分野に深く統合されています。インターフェイス インタラクションの分野では、Google や Apple などの国際的なテクノロジー大手が、携帯電話 AI 革命を前進させる唯一の方法とみなされている大規模なマルチモーダル UI モデルの研究開発に投資してきました。このような状況の中で、中国初の大規模UIモデルが誕生しました。 8月17日、国際エクスペリエンスデザインカンファレンス「IXDC2024」において、AI時代のデザインツールであるMotiffは、独自開発したUIマルチモーダルモデル「Motiff Model」を発表した。世界初のUIデザインツールです
