ホームページ テクノロジー周辺機器 AI HaoMo Zhixing & Tsinghua AIR 自動運転オープンクラス Pan Xing 博士が Haomo の自動運転 AI 練習ロードをその場で公開

HaoMo Zhixing & Tsinghua AIR 自動運転オープンクラス Pan Xing 博士が Haomo の自動運転 AI 練習ロードをその場で公開

Oct 20, 2023 pm 02:29 PM

AI ラージ モデルは深層学習アルゴリズムから出現するため、現在の AI 分野で最もホットな新技術パラダイムになりつつあります。自動運転技術も、大型モデル技術の導入により、モジュラー段階からエンドツーエンドの自動運転に進化する可能性があります。 AI の大型モデルが自動運転の技術的路線を再構築しています。

9月27日、HaoMo Zhixingと清華大学知能産業研究院(AIR)が共催した自動運転に関する質の高いオープンコースが無事終了した。この公開クラスは、自動運転のための現在の主要な AI アルゴリズムに焦点を当て、Hao Mo の具体的な実践と組み合わせて、自動運転実務者、業界パートナー、メディア関係者にエンドツーエンドの自動運転技術の饗宴をもたらします。

このコースは、自動運転に関するオープンコースシリーズの第 3 弾であり、第 1 コースと第 2 コースでは、マクロ産業と技術原理の観点から自動運転知識体系の基礎を紹介しました。第3回では、清華航空の助研究員/助教であるZhan Xianyuan博士が、意思決定最適化の観点からエンドツーエンドの自動運転AIアルゴリズムの特徴と現在の進歩について説明し、テクニカルディレクターのPan Xing博士が講演しました。 HaoMo Zhixing のデータ閉ループ システムから、AI ラージ モデル アルゴリズムが大量のデータをどのように学習して最適化するのか、そして実際にその驚くべき機能をどのように発揮するのかを完全に説明します。

毫末智行&清华AIR自动驾驶公开课 潘兴博士现场揭秘毫末的自动驾驶AI实践之路

「意思決定の最適化の観点から見たエンドツーエンドの自動運転」と題した共有の中で、Zhan Xianyuan 博士は、エンドツーエンドの概念から出発し、自動運転の 30 年にわたる開発の歴史と組み合わせました。アルゴリズムの戦略的学習手法と、清華航空とハオモーの科学研究協力の実践を組み合わせたアルゴリズムを使用して、業界の開発状況と開発状況についての洞察を得ることができます。業界の発展について概要と傾向を判断します。

Zhan Xianyuan 博士は、エンドツーエンドとは、簡単に言えば、すべてのアーキテクチャとさまざまなモジュールを完全な全体に統合し、入力から出力まで直接トレーニングを実施し、意思決定ポイントから学習信号を送信することだと指摘しました。独自のモジュール性の利点は、各モジュールが非常にきれいに分解され、各モジュールのモデリング目標が非常に明確で、解釈可能性が非常に優れていることです。しかし、モジュラーアーキテクチャでは、各モジュールが独自の設計・最適化システムを持っているため、複数のモジュールを組み合わせると誤差が蓄積することは避けられません。エンドツーエンドのメリットは以下の3点です。まず、エンドツーエンドモデル全体は 1 つの非常に大きなモデルとみなすことができるため、構造は非常にシンプルです。すべての目標は、意思決定という最終目標を中心とした最適化と学習です。目標は、最適化レベル。 2 つ目は、入力から最終的な意思決定の出力までエンドツーエンドの学習であり、大量のデータに依存した純粋なデータ駆動型学習を簡単に実装できます。第三に、多くのモデルが同じシステムでエンドツーエンドでトレーニングされるため、異なるモジュール モデルのバックボーンを共有できるため、計算オーバーヘッドが削減されます。

毫末智行&清华AIR自动驾驶公开课 潘兴博士现场揭秘毫末的自动驾驶AI实践之路

Zhan Xianyuan 博士は、すべてのエンドツーエンドの運転モデル​​は大規模な意思決定モデルとみなすことができ、そのようなモデルをトレーニングするには意思決定最適化アルゴリズムの使用が必要であると紹介しました。これには、模倣学習と強化学習が含まれます。模倣学習は、教師あり学習手法を使用してデータから直接トレーニングされたマッピングです。強化学習は、単にデータを模倣するだけではありません。データ自体を超越する可能性が提供され、継続的な学習を通じて最適化できます。利用可能なデータよりも意思決定モデルが重要です。

Zhan Xianyuan 博士の見解では、初期のエンドツーエンドの自動運転モデル​​はすべて小規模な意思決定モデルでしたが、現在、業界に実装されているエンドツーエンドのシステムはすべて巨大なモデルです。このパラダイムは徐々に完全なオフライン学習にまで拡張されました。モデルがより強力になり、より優れたものになるにつれて、セキュリティもより良くなり、一般化レベルでの改善と移行がゆっくりと行われています。さらに、Zhan Xianyuan博士は、模倣学習とオフライン強化学習における清華航空と海蒙の協力についても詳しく紹介し、これらのアルゴリズムは徐々に海蒙の自動運転シナリオの実践に適用されるだろうと述べた。

毫末智行&清华AIR自动驾驶公开课 潘兴博士现场揭秘毫末的自动驾驶AI实践之路

Zhan Xianyuan 博士の共有の後、Pan Xing 博士は「Hai Mo の自動運転 AI への道」をテーマに、Hao Mo の具体的な実践を通じて産業の観点から AI アルゴリズムの重要性を説明しました。パーシング博士は、「自動運転に特化した人工知能技術企業として、海蒙ユーザーは8,000万キロメートル以上の支援運転を行っている。都市NOHも一般化と反復の過程にあり、来年には量産が達成される予定だ」と述べた。 。

毫末智行&清华AIR自动驾驶公开课 潘兴博士现场揭秘毫末的自动驾驶AI实践之路

パーシング氏は、ビッグモデル、ビッグデータ、ビッグコンピューティングパワーのトレンドの下でのデータ規模の増大、アルゴリズム機能の向上、アプリケーションの向上により、現在の業界は自動運転のデータドリブン時代に突入しようとしていると述べた。 3.0。自動運転製品が高速シナリオから都市シナリオに移行するにつれて、自動運転データインテリジェンスシステムの構築が中核的なインフラストラクチャとなります。クローズドデータループを実現するために、Tesla、Haimo、および多くの国内企業などの企業も、独自のクラウド AI 機能とスーパーコンピューティング センターを構築し、より優れたコンピューティング能力と大規模なデータ処理機能を通じてより良い結果を達成しています。

現在、Haomo は独自のデータ インテリジェンス システム MANA を構築しており、今年初めには中国の自動運転業界最大のインテリジェント コンピューティング センターである MANA OASIS Snow Lake·Oasis を構築しました。 HaomoはMANA OASISをベースに、今年4月に業界初の自動運転生成大型モデルDriveGPT Xuehu・Hairuoをリリースした。 「基本的な大規模モデルとして、Haimo は DriveGPT を使用して、データ管理の取得、自動注釈、AIGC シミュレーション データ合成などを含むさらなる AI 機能を構築します。これらのデータ機能とサービスに基づいて、さまざまなモジュールとアルゴリズムのパフォーマンスをさらに向上させます。車両側の機能を強化し、最終的にはより優れた自動運転製品を実現します。」

Pan Xing 博士は、「データ インテリジェンスは自動運転イテレーション全体の中核である。このプロセスでは、膨大なデータ資産を蓄積する必要がある。大規模な AI モデルを通じて、これらのデータ資産をより適切に管理できる」と指摘しました。同時に、データが利用可能になった後もコンピューティング能力が必然的に必要となり、インテリジェント コンピューティング センターの安定的かつ継続的な動作により、大規模モデルの反復や自動運転の改善のための安定した電力の流れも提供されます。

毫末智行&清华AIR自动驾驶公开课 潘兴博士现场揭秘毫末的自动驾驶AI实践之路

Pan Xing 博士は、「データとコンピューティング能力により、現在の自動車とクラウドの連携および共同トレーニング方法は、大規模なモデルを通じて自動車側のアルゴリズムの効果を効果的に向上させることができます。」と述べています。ツールチェーン ラベル付け全体のコストを非常に効果的に削減し、ラベル付けの効率を向上させることができます。同時に、DriveGPT は大きなモデルを使用して、自動車側の小型モデルの機能の向上を直接サポートし、クラウドの大型モデルの機能を自動車側のモデルに適切に転送することもできます。

パーシング博士はまた、「より現実的なシミュレーション データを効率的に取得するには、大規模なモデルが非常に重要な役割を果たします。」と述べ、大規模なモデルを使用することで、テクスチャ、深さ、セマンティクスなどの情報を非常に効果的に学習できます。大規模なモデルの効果的な表現により、データを編集することができ、たとえば、元のビデオにはない車両の障害物を貼り付け、編集し、自由に回転させ、DriveGPT を介してビデオに挿入することで、新しいシミュレーション合成データを取得できます。 。知覚の分野での応用に加えて、大型モデルはインテリジェントな運転の意思決定と計画においても大きな役割を果たします。DriveGPT は人間の運転のユーザー データを使用して継続的に反復および学習し、より良い運転行動と意思決定を実現します。

同時に、Haimo DriveGPT は完全な軌道予測と画像合成を支援するだけでなく、インテリジェントな意思決定を行う機能も備えています。 「DriveGPT には、ビデオを入力して将来の軌道を予測し、運転意思決定プロセスにおける質問に答える機能があり、説明可能な決定を与えることができます。」 これらの機能により、Weimo は、エンドツーエンドの自動運転の出現により、マクロな運転が可能になると信じています。意思決定とマイクロビヘイビアをモデルを通じて一緒に学び理解することが、より効果的な手段となるでしょう。パーシング博士は、次に、Haimou が知覚と認知の 2 つのモデルをより深くエンドツーエンドで接続し、1 つに統合できるようにすると明らかにしました。

毫末智行&清华AIR自动驾驶公开课 潘兴博士现场揭秘毫末的自动驾驶AI实践之路

HaoMo Zhixing と清華大学知能産業研究所 (AIR) は、自動運転に関する質の高い公開コースを 4 段階に分けて開催しており、このコースは 3 番目です。これまでの 2 つのコースでは、清華航空と Hao Mo Zhixing の講師が、1 台の車両によるインテリジェント自動運転、車両と道路の協調型自動運転、高レベルのインテリジェントな道路建設などの自動運転技術の開発を 100 近くの業界メディアに紹介してきました。全員が自動運転AI技術の基本原理と自動運転における大型モデルの現在の応用傾向について説明しました。この自動運転に関する質の高い公開コースで、ハイモと清華航空は、より詳細なAIアルゴリズムと自動運転AIシステムの原則を自動運転業界のオブザーバーと共有し、オンラインおよびオフラインのゲストから活発な質問や意見交換を受けました。

自動運転の星と海に直面して、将来の目標を真に達成できるのは行動だけです。ハイモと清華航空は、自動運転に関する質の高い公開コースを通じて、業界の上級メディア関係者と協力して、自動運転Aアルゴリズムに関する最新の研究結果と実践経験を収集し、山や海を越えて協力して共有してきました。 AI知識の英知を結集し、自動運転業界に貢献する貴重な技術的合意と知識の蓄積。

以上がHaoMo Zhixing & Tsinghua AIR 自動運転オープンクラス Pan Xing 博士が Haomo の自動運転 AI 練習ロードをその場で公開の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

カーソルAIでバイブコーディングを試してみましたが、驚くべきことです! カーソルAIでバイブコーディングを試してみましたが、驚くべきことです! Mar 20, 2025 pm 03:34 PM

バイブコーディングは、無限のコード行の代わりに自然言語を使用してアプリケーションを作成できるようにすることにより、ソフトウェア開発の世界を再構築しています。 Andrej Karpathyのような先見の明に触発されて、この革新的なアプローチは開発を許可します

2025年2月のトップ5 Genai発売:GPT-4.5、Grok-3など! 2025年2月のトップ5 Genai発売:GPT-4.5、Grok-3など! Mar 22, 2025 am 10:58 AM

2025年2月は、生成AIにとってさらにゲームを変える月であり、最も期待されるモデルのアップグレードと画期的な新機能のいくつかをもたらしました。 Xai’s Grok 3とAnthropic's Claude 3.7 SonnetからOpenaiのGまで

オブジェクト検出にYolo V12を使用する方法は? オブジェクト検出にYolo V12を使用する方法は? Mar 22, 2025 am 11:07 AM

Yolo(あなたは一度だけ見ています)は、前のバージョンで各反復が改善され、主要なリアルタイムオブジェクト検出フレームワークでした。最新バージョンYolo V12は、精度を大幅に向上させる進歩を紹介します

SORA vs VEO 2:よりリアルなビデオを作成するのはどれですか? SORA vs VEO 2:よりリアルなビデオを作成するのはどれですか? Mar 10, 2025 pm 12:22 PM

GoogleのVEO 2とOpenaiのSORA:どのAIビデオジェネレーターが最高でしたか? どちらのプラットフォームも印象的なAIビデオを生成しますが、その強みはさまざまな領域にあります。 この比較は、さまざまなプロンプトを使用して、どのツールがニーズに最適かを明らかにします。 t

Google' s Gencast:Gencast Mini Demoを使用した天気予報 Google' s Gencast:Gencast Mini Demoを使用した天気予報 Mar 16, 2025 pm 01:46 PM

Google Deepmind's Gencast:天気予報のための革新的なAI 天気予報は、初歩的な観察から洗練されたAI駆動の予測に移行する劇的な変化を受けました。 Google DeepmindのGencast、グラウンドブレイク

ChatGpt 4 oは利用できますか? ChatGpt 4 oは利用できますか? Mar 28, 2025 pm 05:29 PM

CHATGPT 4は現在利用可能で広く使用されており、CHATGPT 3.5のような前任者と比較して、コンテキストを理解し、一貫した応答を生成することに大幅な改善を示しています。将来の開発には、よりパーソナライズされたインターが含まれる場合があります

chatgptよりも優れたAIはどれですか? chatgptよりも優れたAIはどれですか? Mar 18, 2025 pm 06:05 PM

この記事では、Lamda、Llama、GrokのようなChatGptを超えるAIモデルについて説明し、正確性、理解、業界への影響における利点を強調しています(159文字)

O1対GPT-4O:OpenAIの新しいモデルはGPT-4Oよりも優れていますか? O1対GPT-4O:OpenAIの新しいモデルはGPT-4Oよりも優れていますか? Mar 16, 2025 am 11:47 AM

OpenaiのO1:12日間の贈り物は、これまでで最も強力なモデルから始まります 12月の到着は、世界の一部の地域で雪片が世界的に減速し、雪片がもたらされますが、Openaiは始まったばかりです。 サム・アルトマンと彼のチームは12日間のギフトを立ち上げています

See all articles