2月17日のニュースによると、Haomo Zhixingは、同社の大規模な自動運転コグニティブモデルがDriveGPTに正式にアップグレードされ、2023年4月のHAOMOAI DAYで最新の重要な進歩を発表すると発表しました。
ChatGPT がネットワーク全体で普及するにつれて、Transformer の大規模モデルとそれが使用する「ヒューマン フィードバック強化学習 (RLHF)」テクノロジーが再び業界の注目を集めています。自動運転の分野では、Feimo は中国で初めて Transformer 大型モデルをデータ インテリジェンス システム MANA に導入しました。 2023年1月のHAOMO AI DAYで、Haomo Zhixingの最高経営責任者(CEO)Gu Weihao氏は、Haomoが発表した人間の運転のための大規模な自己教師あり認知モデルがChatGPTの実装アイデアを参考にし、RLHF(ヒューマンフィードバック強化学習)テクノロジーを採用したと紹介した。自動運転の認知的意思決定モデルを継続的に最適化するために、実際の人間のドライバーの引き継ぎデータを導入します。
Haimo の認知的意思決定アルゴリズムは、3 つの進化段階を経ました。最初の段階では、人間の運転行動に直接適合する個々のシナリオのエンドツーエンドの模倣学習を導入します。第 2 段階は、大規模な認知モデルを使用して、大量の通常の人間の運転データを導入し、プロンプトを通じて制御可能で説明可能な認知的意思決定を実現することです。現在の段階である第 3 段階では、実際の乗っ取りデータが導入され、人間の運転による乗っ取りデータから学習するために大規模モデルで RLHF アルゴリズムの使用が開始されます。この目的を達成するために、Hao Mo は「古い戦略、乗っ取り戦略、手動ラベル戦略」を含むペアワイズ ランキング モデルを構築しました。このランキング モデルに基づいて、Haimo はさまざまな計画シナリオの下で最適な意思決定を行うための自動運転の意思決定に対する報酬モデルを構築しました。この大型モデルにより、Uターンやラウンドアバウトなどの困難なシーンでの通過率が30%以上向上しました。
#2 月 17 日、Haimo Zhixing は、大規模な人間運転自己監視認知モデルを「DriveGPT」に正式にアップグレードしました。これは、世界初の大規模な自動運転モデルでもあります。認知モデルを推進します。現在、Haimo DriveGPT はモデルの構築と第 1 段階のデータ実行を完了しており、パラメーター スケールは GPT-2 のレベルをベンチマークできます。今後、DriveGPTは大規模な実際の乗っ取りデータの導入を継続し、人間の運転データフィードバックの強化学習を通じて評価効果を継続的に改善し、小型の車側モデルの運転効果を評価するためのクラウド評価モデルとしても使用されます。 Haomo DriveGPT の最新の重要な進捗状況は、2023 年 4 月の第 8 回 HAOMO AI DAY で発表されます。
以上がHaoMo Zhixing: 大規模な自動運転認知モデルが正式に DriveGPT にアップグレードされましたの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。