


HaoMo Zhixing & Tsinghua AIR 自動運転オープンクラス Pan Xing 博士が Haomo の自動運転 AI 練習ロードをその場で公開
AI ラージ モデルは深層学習アルゴリズムから出現するため、現在の AI 分野で最もホットな新技術パラダイムになりつつあります。自動運転技術も、大型モデル技術の導入により、モジュラー段階からエンドツーエンドの自動運転に進化する可能性があります。 AI の大型モデルが自動運転の技術的路線を再構築しています。
9月27日、HaoMo Zhixingと清華大学知能産業研究院(AIR)が共催した自動運転に関する質の高いオープンコースが無事終了した。この公開クラスは、自動運転のための現在の主要な AI アルゴリズムに焦点を当て、Hao Mo の具体的な実践と組み合わせて、自動運転実務者、業界パートナー、メディア関係者にエンドツーエンドの自動運転技術の饗宴をもたらします。
このコースは、自動運転に関するオープンコースシリーズの第 3 弾であり、第 1 コースと第 2 コースでは、マクロ産業と技術原理の観点から自動運転知識体系の基礎を紹介しました。第3回では、清華航空の助研究員/助教であるZhan Xianyuan博士が、意思決定最適化の観点からエンドツーエンドの自動運転AIアルゴリズムの特徴と現在の進歩について説明し、テクニカルディレクターのPan Xing博士が講演しました。 HaoMo Zhixing のデータ閉ループ システムから、AI ラージ モデル アルゴリズムが大量のデータをどのように学習して最適化するのか、そして実際にその驚くべき機能をどのように発揮するのかを完全に説明します。
「意思決定の最適化の観点から見たエンドツーエンドの自動運転」と題した共有の中で、Zhan Xianyuan 博士は、エンドツーエンドの概念から出発し、自動運転の 30 年にわたる開発の歴史と組み合わせました。アルゴリズムの戦略的学習手法と、清華航空とハオモーの科学研究協力の実践を組み合わせたアルゴリズムを使用して、業界の開発状況と開発状況についての洞察を得ることができます。業界の発展について概要と傾向を判断します。
Zhan Xianyuan 博士は、エンドツーエンドとは、簡単に言えば、すべてのアーキテクチャとさまざまなモジュールを完全な全体に統合し、入力から出力まで直接トレーニングを実施し、意思決定ポイントから学習信号を送信することだと指摘しました。独自のモジュール性の利点は、各モジュールが非常にきれいに分解され、各モジュールのモデリング目標が非常に明確で、解釈可能性が非常に優れていることです。しかし、モジュラーアーキテクチャでは、各モジュールが独自の設計・最適化システムを持っているため、複数のモジュールを組み合わせると誤差が蓄積することは避けられません。エンドツーエンドのメリットは以下の3点です。まず、エンドツーエンドモデル全体は 1 つの非常に大きなモデルとみなすことができるため、構造は非常にシンプルです。すべての目標は、意思決定という最終目標を中心とした最適化と学習です。目標は、最適化レベル。 2 つ目は、入力から最終的な意思決定の出力までエンドツーエンドの学習であり、大量のデータに依存した純粋なデータ駆動型学習を簡単に実装できます。第三に、多くのモデルが同じシステムでエンドツーエンドでトレーニングされるため、異なるモジュール モデルのバックボーンを共有できるため、計算オーバーヘッドが削減されます。
Zhan Xianyuan 博士は、すべてのエンドツーエンドの運転モデルは大規模な意思決定モデルとみなすことができ、そのようなモデルをトレーニングするには意思決定最適化アルゴリズムの使用が必要であると紹介しました。これには、模倣学習と強化学習が含まれます。模倣学習は、教師あり学習手法を使用してデータから直接トレーニングされたマッピングです。強化学習は、単にデータを模倣するだけではありません。データ自体を超越する可能性が提供され、継続的な学習を通じて最適化できます。利用可能なデータよりも意思決定モデルが重要です。
Zhan Xianyuan 博士の見解では、初期のエンドツーエンドの自動運転モデルはすべて小規模な意思決定モデルでしたが、現在、業界に実装されているエンドツーエンドのシステムはすべて巨大なモデルです。このパラダイムは徐々に完全なオフライン学習にまで拡張されました。モデルがより強力になり、より優れたものになるにつれて、セキュリティもより良くなり、一般化レベルでの改善と移行がゆっくりと行われています。さらに、Zhan Xianyuan博士は、模倣学習とオフライン強化学習における清華航空と海蒙の協力についても詳しく紹介し、これらのアルゴリズムは徐々に海蒙の自動運転シナリオの実践に適用されるだろうと述べた。
Zhan Xianyuan 博士の共有の後、Pan Xing 博士は「Hai Mo の自動運転 AI への道」をテーマに、Hao Mo の具体的な実践を通じて産業の観点から AI アルゴリズムの重要性を説明しました。パーシング博士は、「自動運転に特化した人工知能技術企業として、海蒙ユーザーは8,000万キロメートル以上の支援運転を行っている。都市NOHも一般化と反復の過程にあり、来年には量産が達成される予定だ」と述べた。 。
パーシング氏は、ビッグモデル、ビッグデータ、ビッグコンピューティングパワーのトレンドの下でのデータ規模の増大、アルゴリズム機能の向上、アプリケーションの向上により、現在の業界は自動運転のデータドリブン時代に突入しようとしていると述べた。 3.0。自動運転製品が高速シナリオから都市シナリオに移行するにつれて、自動運転データインテリジェンスシステムの構築が中核的なインフラストラクチャとなります。クローズドデータループを実現するために、Tesla、Haimo、および多くの国内企業などの企業も、独自のクラウド AI 機能とスーパーコンピューティング センターを構築し、より優れたコンピューティング能力と大規模なデータ処理機能を通じてより良い結果を達成しています。
現在、Haomo は独自のデータ インテリジェンス システム MANA を構築しており、今年初めには中国の自動運転業界最大のインテリジェント コンピューティング センターである MANA OASIS Snow Lake·Oasis を構築しました。 HaomoはMANA OASISをベースに、今年4月に業界初の自動運転生成大型モデルDriveGPT Xuehu・Hairuoをリリースした。 「基本的な大規模モデルとして、Haimo は DriveGPT を使用して、データ管理の取得、自動注釈、AIGC シミュレーション データ合成などを含むさらなる AI 機能を構築します。これらのデータ機能とサービスに基づいて、さまざまなモジュールとアルゴリズムのパフォーマンスをさらに向上させます。車両側の機能を強化し、最終的にはより優れた自動運転製品を実現します。」
Pan Xing 博士は、「データ インテリジェンスは自動運転イテレーション全体の中核である。このプロセスでは、膨大なデータ資産を蓄積する必要がある。大規模な AI モデルを通じて、これらのデータ資産をより適切に管理できる」と指摘しました。同時に、データが利用可能になった後もコンピューティング能力が必然的に必要となり、インテリジェント コンピューティング センターの安定的かつ継続的な動作により、大規模モデルの反復や自動運転の改善のための安定した電力の流れも提供されます。
パーシング博士はまた、「より現実的なシミュレーション データを効率的に取得するには、大規模なモデルが非常に重要な役割を果たします。」と述べ、大規模なモデルを使用することで、テクスチャ、深さ、セマンティクスなどの情報を非常に効果的に学習できます。大規模なモデルの効果的な表現により、データを編集することができ、たとえば、元のビデオにはない車両の障害物を貼り付け、編集し、自由に回転させ、DriveGPT を介してビデオに挿入することで、新しいシミュレーション合成データを取得できます。 。知覚の分野での応用に加えて、大型モデルはインテリジェントな運転の意思決定と計画においても大きな役割を果たします。DriveGPT は人間の運転のユーザー データを使用して継続的に反復および学習し、より良い運転行動と意思決定を実現します。
同時に、Haimo DriveGPT は完全な軌道予測と画像合成を支援するだけでなく、インテリジェントな意思決定を行う機能も備えています。 「DriveGPT には、ビデオを入力して将来の軌道を予測し、運転意思決定プロセスにおける質問に答える機能があり、説明可能な決定を与えることができます。」 これらの機能により、Weimo は、エンドツーエンドの自動運転の出現により、マクロな運転が可能になると信じています。意思決定とマイクロビヘイビアをモデルを通じて一緒に学び理解することが、より効果的な手段となるでしょう。パーシング博士は、次に、Haimou が知覚と認知の 2 つのモデルをより深くエンドツーエンドで接続し、1 つに統合できるようにすると明らかにしました。
自動運転の星と海に直面して、将来の目標を真に達成できるのは行動だけです。ハイモと清華航空は、自動運転に関する質の高い公開コースを通じて、業界の上級メディア関係者と協力して、自動運転Aアルゴリズムに関する最新の研究結果と実践経験を収集し、山や海を越えて協力して共有してきました。 AI知識の英知を結集し、自動運転業界に貢献する貴重な技術的合意と知識の蓄積。
以上がHaoMo Zhixing & Tsinghua AIR 自動運転オープンクラス Pan Xing 博士が Haomo の自動運転 AI 練習ロードをその場で公開の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック









バイブコーディングは、無限のコード行の代わりに自然言語を使用してアプリケーションを作成できるようにすることにより、ソフトウェア開発の世界を再構築しています。 Andrej Karpathyのような先見の明に触発されて、この革新的なアプローチは開発を許可します

2025年2月は、生成AIにとってさらにゲームを変える月であり、最も期待されるモデルのアップグレードと画期的な新機能のいくつかをもたらしました。 Xai’s Grok 3とAnthropic's Claude 3.7 SonnetからOpenaiのGまで

Yolo(あなたは一度だけ見ています)は、前のバージョンで各反復が改善され、主要なリアルタイムオブジェクト検出フレームワークでした。最新バージョンYolo V12は、精度を大幅に向上させる進歩を紹介します

GoogleのVEO 2とOpenaiのSORA:どのAIビデオジェネレーターが最高でしたか? どちらのプラットフォームも印象的なAIビデオを生成しますが、その強みはさまざまな領域にあります。 この比較は、さまざまなプロンプトを使用して、どのツールがニーズに最適かを明らかにします。 t

Google Deepmind's Gencast:天気予報のための革新的なAI 天気予報は、初歩的な観察から洗練されたAI駆動の予測に移行する劇的な変化を受けました。 Google DeepmindのGencast、グラウンドブレイク

CHATGPT 4は現在利用可能で広く使用されており、CHATGPT 3.5のような前任者と比較して、コンテキストを理解し、一貫した応答を生成することに大幅な改善を示しています。将来の開発には、よりパーソナライズされたインターが含まれる場合があります

この記事では、Lamda、Llama、GrokのようなChatGptを超えるAIモデルについて説明し、正確性、理解、業界への影響における利点を強調しています(159文字)

OpenaiのO1:12日間の贈り物は、これまでで最も強力なモデルから始まります 12月の到着は、世界の一部の地域で雪片が世界的に減速し、雪片がもたらされますが、Openaiは始まったばかりです。 サム・アルトマンと彼のチームは12日間のギフトを立ち上げています
