自動運転の主要な技術的困難に関する研究
米国自動車技術者協会は、車両の知能の程度に基づいて、自動運転を L0 ~ L5 の 6 つのレベルに分けています。
- L0 は、自動化なし (NA)、つまり、ドライバーが自動運転を行う従来の車です。ステアリング、ブレーキ、加速、減速、駐車などのすべての操作タスクを実行します
- L1 は、ステアリングホイールや加速中のハンドルなど、運転者に運転警告や支援を提供できる運転アシスタント (DA) です。減速:1つの操作をサポートし、残りはドライバーが操作します
- L2は部分自動化(PA)であり、ステアリングホイールと加減速の複数の操作を車両が提供し、ドライバーが責任を負います。他の運転操作の場合、
- L3 は条件付き自動化 (CA)、つまり自動運転システムがほとんどの運転操作を完了し、ドライバーは緊急事態への備えに集中する必要があります。
- L4 は高度な自動化です。 (HA) )、車両がすべての運転操作を完了し、ドライバーは集中する必要はありませんが、道路条件や環境条件は限られています
- L5 は、あらゆる道路下で自動運転によって運転されます。システムがすべての運転操作を完了するため、ドライバーは集中する必要がありません。
自動運転車のソフトウェアとハードウェアのアーキテクチャを図 2 に示します。これは主に環境認識層、意思決定と計画層、制御層、実行層に分かれています。環境認識 (知覚) レイヤーは、主にライダー、ミリ波レーダー、超音波レーダー、車載カメラ、暗視システム、GPS、ジャイロスコープなどのセンサーを通じて車両の環境情報と車両状態情報を取得します。具体的には、車線境界線の検出、交通状況などです。信号認識、交通標識認識、歩行者検出、車両検出、障害物認識および車両位置決めなど。設定されたルート計画と環境に基づいて、意思決定および計画層がタスク計画、行動計画、軌道計画に分割されます。および車両自体の状態を考慮して、次の特定の運転タスク (車線維持、車線変更、追従、追い越し、衝突回避など)、動作 (加速、減速、方向転換、ブレーキなど) および経路 (運転軌跡) を計画します。 ; 制御層と実行 この層は、車両動力学システムモデルに基づいて車両の駆動、制動、ステアリングなどを制御し、車両が所定の走行軌跡をたどるように制御します。
この記事では、主に環境認識技術、高精度測位技術、意思決定・計画技術、制御・実行技術など多くのキーテクノロジーを紹介します。
環境知覚技術
環境知覚とは、障害物の種類、道路標識や標識、走行車両の検出、交通情報の言語分類、その他のデータなど、環境の状況を理解する能力を指します。測位は認識結果の後処理であり、測位機能を通じて車両が環境に対する相対的な位置を理解するのに役立ちます。環境認識では、車両の周囲環境を正確に理解し、これに基づいて対応する計画と決定を行うために、センサーを通じて大量の周囲環境情報を取得する必要があります。
自動運転車で一般的に使用される環境認識センサーには、カメラ、ライダー、ミリ波レーダー、赤外線および超音波レーダーなどが含まれます。カメラは、自動運転車用の環境認識センサーとして最も一般的に使用され、最も単純で人間の目の撮像原理に最も近いものです。車両周囲の環境をリアルタイムに撮影し、撮影した画像をCV技術で解析することで、車両周囲の車両や歩行者の検知、標識認識などの機能を実現します。
カメラの主な利点は、高解像度と低コストです。ただし、夜間、雨、雪、霧などの悪天候では、カメラの性能が急激に低下します。また、カメラの視距離には限界があり、遠距離の観察は苦手です。
ミリ波レーダーは、自動運転車にも一般的に使用されるセンサーです。ミリ波レーダーは、ミリ波帯(波長1〜10 mm、周波数領域30〜300GHz)で動作するレーダーを指します。ToF技術(Time)に基づいています。飛行中の物体が検出されます。ミリ波レーダーは、ミリ波の信号を外部に発信し続け、目標から戻ってくる信号を受信し、信号の送信と受信の時間差から目標と車両との距離を測定します。したがって、ミリ波レーダーは主に、死角検出、障害物回避支援、駐車支援、アダプティブクルーズなど、車と周囲の物体との衝突を回避するために使用されます。ミリ波レーダーは強力な抗干渉能力を備えており、雨、砂、塵、煙、プラズマを透過する能力はレーザーや赤外線よりもはるかに強力で、全天候で動作します。しかし、信号の減衰が大きい、建物や人体などに遮られやすい、伝送距離が短い、解像度が低い、撮像が難しいなどの欠点もあります。
Lidar は、ToF テクノロジーを使用してターゲットの位置と距離を決定します。 LiDARはレーザー光を照射して対象物を検出するため、検出精度や感度が高く、検出範囲も広いですが、空気中の雨や雪、霧などの影響を受けやすく、コストも高いため制限があります。その主な理由。車載ライダーは、照射されるレーザー光の数に応じて、シングルライン、4ライン、8ライン、16ライン、64ラインライダーに分類できます。次の表 (表 1) を使用して、主流のセンサーの長所と短所を比較できます。
自動運転環境認識は通常、「弱い知覚+超知能」と「強い知覚+強い知能」の2つの技術的ルートを採用します。 「弱い知覚 + スーパーインテリジェンス」技術は、主にカメラとディープラーニング技術に依存して環境知覚を実現し、LIDAR には依存しません。この技術は、人間は両目で運転でき、車もカメラを利用して周囲の環境をはっきりと見ることができると考えています。超知能の実現が一時的に難しい場合、無人運転を実現するには知覚能力を高める必要がある。これがいわゆる「強い知覚+強い知能」の技術的ルートである。
「弱い知覚 + 超知能」技術ルートと比較して、「強い知覚 + 強い知能」技術ルートの最大の特徴は、ライダーセンサーの追加により、知覚能力が大幅に向上していることです。テスラは「弱い知能 + 超知能」技術ルートを採用していますが、Google Waymo、百度アポロ、ウーバー、フォードモーターなどの人工知能企業、旅行会社、伝統的な自動車会社はすべて「強い知覚 + 強い知能」技術ルートを採用しています。
高精度測位技術
測位の目的は、外部環境に対する自動運転車両の正確な位置を取得することであり、これは自動運転車両にとって不可欠な基盤です。複雑な都市道路を走行する場合、測位精度は 10 cm 以内の誤差が必要です。たとえば、車両と交差点の間の距離を正確に知ることによってのみ、より正確な予測と準備を行うことができます。また、車両の位置を正確に把握することによってのみ、車両が位置する車線を決定することができます。測位誤差が大きいと、完全な交通事故につながる可能性があります。
GPS は現在最も広く使用されている測位方法であり、GPS の精度が高いほど、GPS センサーは高価になります。しかし、現在の商用 GPS 技術の測位精度は十分とは程遠く、その精度はメートルレベルに過ぎず、トンネルの障害物や信号遅延などの要因によって簡単に干渉されます。この問題を解決するために、クアルコムは、GNSS グローバル ナビゲーション、カメラ、IMU 慣性ナビゲーション、車輪速度センサーなどの複数の自動車コンポーネントからの情報を統合する、ビジョン強化高精度測位 (VEPP) テクノロジーを開発しました。車線まで正確なグローバルリアルタイム測位を実現するための融合。
意思決定および計画テクノロジー
意思決定計画は自動運転の重要な部分の 1 つであり、まず複数のセンサー情報を融合し、運転ニーズに基づいてタスクを決定し、既存の障害物を回避します。特定の制約を考慮して、2 点間で選択できる複数の安全な経路を計画し、これらの経路の中から最適な経路を車両の走行軌跡として選択することを計画といいます。さまざまなレベルに応じて、グローバル プランニングとローカル プランニングの 2 つのタイプに分類できます。グローバル プランニングは、取得した地図情報を使用して、特定の条件下で衝突のない最適な経路を計画します。たとえば、上海から北京までの道路はたくさんありますが、その 1 つを走行ルートとして計画することが全体的な計画になります。
グリッド法、ビジュアルダイアグラム法、トポロジー法、自由空間法、ニューラルネットワーク法などの静的パス計画アルゴリズムローカルプランニングはグローバルプランニングに基づいており、ローカル環境情報に基づいて、未知の障害物との衝突を回避し、最終的に目標地点に到達するプロセスです。たとえば、グローバルに計画された上海から北京までのルートには他の車両や障害物が存在します。これらの障害物や車両を回避するには、方向転換して車線を調整する必要があります。これがローカル パス プランニングです。ローカル パス プランニング方法には、人工ポテンシャル フィールド法、ベクトル ドメイン ヒストグラム法、仮想力場法、遺伝的アルゴリズム、およびその他の動的パス プランニング アルゴリズムが含まれます。
意思決定および計画の層は、インテリジェンスを直接反映し、車両および車両全体の運転の安全性において決定的な役割を果たします。一般的な意思決定計画のアーキテクチャには、階層型のプログレッシブが含まれます。そしてリアクティブ、そしてその2つのハイブリッドです。
階層型プログレッシブアーキテクチャは直列システムの構造であり、インテリジェント駆動システムのモジュールは明確な順序で配置されており、したがって、次のモジュールの入力となります。知覚計画行動構造と呼ばれます。しかし、この構造の信頼性は決して高くはなく、特定のモジュールでソフトウェアまたはハードウェアの障害が発生すると、情報の流れ全体に影響が及び、システム全体が崩壊したり、機能不全に陥ったりする可能性があります。
リアクティブ アーキテクチャは並列構造を採用しており、センサー入力に基づいて直接決定を下すことができるため、生成されるアクションは、知覚されたアクションの特性を強調することができます。まったく馴染みのない環境に適しています。リアクティブ アーキテクチャの多くの動作には、主に単純な特殊なタスクが含まれるため、計画と制御が緊密に統合され、占有されるストレージ容量が大きくないため、高速な応答と強力なリアルタイム パフォーマンスを生み出すことができます。同時に、各 1 つの層はシステムの特定の動作のみを担当する必要があり、システム全体が低レベルから高レベルへの移行を便利かつ柔軟に実現できます。レイヤーは依然として意味のあるアクションを生成できますが、システムの堅牢性は大幅に向上していますが、システムのアクション実行の柔軟性により、さまざまな制御ループ間の競合を解決し、合意するために特定の調整メカニズムが必要になることです。有意義な結果を得るために、アクチュエータの競合。
階層システムの構造とリアクティブシステムの構造にはそれぞれ長所と短所があり、複雑で変化する走行環境の要件に単独で対応することは困難です。ますます多くの業界専門家がハイブリッド アーキテクチャを研究し始めており、この 2 つの利点を効果的に組み合わせて、グローバル プランニング レベルでの目標によって定義される階層的な動作と、リアクティブ システムのローカル プランニング レベルでの目標指向の検索を生成します。
制御・実行技術
自動運転の中核となる制御技術は、車両の前後方向制御、横方向制御、縦方向制御、車両走行・制動制御であり、横方向制御はステアリングである。ホイールの角度調整とタイヤ力の制御により、前後左右の自動制御を実現し、与えられた目標や制約に応じて車両の動作を自動制御できます。
車両の縦方向制御とは、走行速度の方向の制御、つまり、車両の速度と前後の車両との車間距離を自動的に制御することです。障害物。クルーズコントロールと緊急ブレーキ制御は、どちらも自動運転における縦方向制御の代表的な例です。このような制御の問題は、モータードライブ、エンジン、トランスミッション、ブレーキシステムの制御に起因すると考えられます。さまざまなモーター、エンジン、トランスミッション モデル、車両動作モデル、ブレーキ プロセス モデルがさまざまなコントローラー アルゴリズムと組み合わされて、さまざまな縦方向の制御モードが形成されます。
車両の横方向制御とは、車両の進行方向に対して垂直な制御を指し、その目的は、車両の速度、荷重、風の抵抗、道路状況が異なる場合でも、車両を制御して希望の走行ルートを自動的に維持し、良好な乗り心地と安定性を実現することです。車両の横方向制御には 2 つの基本的な設計方法があり、1 つはドライバーのシミュレーションに基づいています (1 つは、より単純なダイナミクス モデルとドライバーの操作ルールを使用してコントローラーを設計する方法であり、もう 1 つはドライバーの操作プロセスを使用する方法です。データ トレーニング コントローラーは、もう一つは、車両の横運動力学モデルに与える制御手法(正確な車両の横運動モデルを確立する必要がある。代表的なモデルとしては、左右の特性を考慮した単線モデルなどがある)。
概要
上記で紹介した環境認識、正確な位置決め、意思決定計画、制御の実行に加えて、自動運転車には高精度地図などの重要なテクノロジーも含まれます。 、V2X、自動運転車のテスト。自動運転技術は、人工知能、高性能チップ、通信技術、センサー技術、車両制御技術、ビッグデータ技術など多くの分野の技術を組み合わせて実現する技術です。また、自動運転技術の実現には、自動運転の要件を満たす基盤的な交通機関の整備や、自動運転に関する法規制の検討も必要となります。
以上が自動運転の主要な技術的困難に関する研究の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック











このサイトは6月27日、JianyingはByteDanceの子会社であるFaceMeng Technologyによって開発されたビデオ編集ソフトウェアであり、Douyinプラットフォームに依存しており、基本的にプラットフォームのユーザー向けに短いビデオコンテンツを作成すると報告しました。 Windows、MacOS、その他のオペレーティング システム。 Jianyingは会員システムのアップグレードを正式に発表し、インテリジェント翻訳、インテリジェントハイライト、インテリジェントパッケージング、デジタルヒューマン合成などのさまざまなAIブラックテクノロジーを含む新しいSVIPを開始しました。価格的には、クリッピングSVIPの月額料金は79元、年会費は599元(当サイト注:月額49.9元に相当)、継続月額サブスクリプションは月額59元、継続年間サブスクリプションは、年間499元(月額41.6元に相当)です。さらに、カット担当者は、ユーザーエクスペリエンスを向上させるために、オリジナルのVIPに登録している人は、

検索強化生成およびセマンティック メモリを AI コーディング アシスタントに組み込むことで、開発者の生産性、効率、精度を向上させます。 JanakiramMSV 著者の EnhancingAICodingAssistantswithContextUsingRAGandSEM-RAG から翻訳。基本的な AI プログラミング アシスタントは当然役に立ちますが、ソフトウェア言語とソフトウェア作成の最も一般的なパターンに関する一般的な理解に依存しているため、最も適切で正しいコードの提案を提供できないことがよくあります。これらのコーディング アシスタントによって生成されたコードは、彼らが解決する責任を負っている問題の解決には適していますが、多くの場合、個々のチームのコーディング標準、規約、スタイルには準拠していません。これにより、コードがアプリケーションに受け入れられるように修正または調整する必要がある提案が得られることがよくあります。

AIGC について詳しくは、51CTOAI.x コミュニティ https://www.51cto.com/aigc/Translator|Jingyan Reviewer|Chonglou を参照してください。これらの質問は、インターネット上のどこでも見られる従来の質問バンクとは異なります。既成概念にとらわれずに考える必要があります。大規模言語モデル (LLM) は、データ サイエンス、生成人工知能 (GenAI)、および人工知能の分野でますます重要になっています。これらの複雑なアルゴリズムは人間のスキルを向上させ、多くの業界で効率とイノベーションを推進し、企業が競争力を維持するための鍵となります。 LLM は、自然言語処理、テキスト生成、音声認識、推奨システムなどの分野で幅広い用途に使用できます。 LLM は大量のデータから学習することでテキストを生成できます。

大規模言語モデル (LLM) は巨大なテキスト データベースでトレーニングされ、そこで大量の現実世界の知識を取得します。この知識はパラメータに組み込まれており、必要なときに使用できます。これらのモデルの知識は、トレーニングの終了時に「具体化」されます。事前トレーニングの終了時に、モデルは実際に学習を停止します。モデルを調整または微調整して、この知識を活用し、ユーザーの質問により自然に応答する方法を学びます。ただし、モデルの知識だけでは不十分な場合があり、モデルは RAG を通じて外部コンテンツにアクセスできますが、微調整を通じてモデルを新しいドメインに適応させることが有益であると考えられます。この微調整は、ヒューマン アノテーターまたは他の LLM 作成物からの入力を使用して実行され、モデルは追加の実世界の知識に遭遇し、それを統合します。

編集者 |ScienceAI 質問応答 (QA) データセットは、自然言語処理 (NLP) 研究を促進する上で重要な役割を果たします。高品質の QA データ セットは、モデルの微調整に使用できるだけでなく、大規模言語モデル (LLM) の機能、特に科学的知識を理解し推論する能力を効果的に評価することもできます。現在、医学、化学、生物学、その他の分野をカバーする多くの科学 QA データ セットがありますが、これらのデータ セットにはまだいくつかの欠点があります。まず、データ形式は比較的単純で、そのほとんどが多肢選択式の質問であり、評価は簡単ですが、モデルの回答選択範囲が制限され、科学的な質問に回答するモデルの能力を完全にテストすることはできません。対照的に、自由回答型の Q&A

編集者 | KX 医薬品の研究開発の分野では、タンパク質とリガンドの結合親和性を正確かつ効果的に予測することが、医薬品のスクリーニングと最適化にとって重要です。しかし、現在の研究では、タンパク質とリガンドの相互作用における分子表面情報の重要な役割が考慮されていません。これに基づいて、アモイ大学の研究者らは、初めてタンパク質の表面、3D 構造、配列に関する情報を組み合わせ、クロスアテンション メカニズムを使用して異なるモダリティの特徴を比較する、新しいマルチモーダル特徴抽出 (MFE) フレームワークを提案しました。アライメント。実験結果は、この方法がタンパク質-リガンド結合親和性の予測において最先端の性能を達成することを実証しています。さらに、アブレーション研究は、この枠組み内でのタンパク質表面情報と多峰性特徴の位置合わせの有効性と必要性を実証しています。 「S」で始まる関連研究

機械学習は人工知能の重要な分野であり、明示的にプログラムしなくてもコンピューターにデータから学習して能力を向上させる機能を提供します。機械学習は、画像認識や自然言語処理から、レコメンデーションシステムや不正行為検出に至るまで、さまざまな分野で幅広く応用されており、私たちの生活様式を変えつつあります。機械学習の分野にはさまざまな手法や理論があり、その中で最も影響力のある 5 つの手法は「機械学習の 5 つの流派」と呼ばれています。 5 つの主要な学派は、象徴学派、コネクショニスト学派、進化学派、ベイジアン学派、およびアナロジー学派です。 1. 象徴主義は、象徴主義とも呼ばれ、論理的推論と知識の表現のためのシンボルの使用を強調します。この学派は、学習は既存の既存の要素を介した逆演繹のプロセスであると信じています。

中国科学院オートメーション研究所の深層強化学習チームは、Li Auto氏らとともに、マルチモーダル大規模言語モデルMLLM(PlanAgent)に基づく自動運転のための新しい閉ループ計画フレームワークを提案した。この手法は、シーンの鳥瞰図とグラフベースのテキスト プロンプトを入力として受け取り、マルチモーダル大規模言語モデルのマルチモーダル理解機能と常識推論機能を利用して、シーンの理解から生成までの階層的推論を実行します。水平移動と垂直移動の指示を作成し、プランナーが必要とする指示をさらに生成します。このメソッドは、大規模で困難な nuPlan ベンチマークでテストされており、実験では、PlanAgent が通常のシナリオとロングテール シナリオの両方で最先端 (SOTA) のパフォーマンスを達成することが示されています。従来の大規模言語モデル (LLM) メソッドと比較して、PlanAgent
