自動運転におけるSLAM技術の応用について論じた記事
自動運転において測位はかけがえのない位置を占めており、今後の発展が期待されています。現在、自動運転における測位はRTKと高精度地図に依存しているため、自動運転の実装には多大なコストと困難が加わります。想像してみてください。人間が運転するとき、自分自身の全世界の高精度測位や詳細な周囲環境を知る必要はありません。全地球的なナビゲーション パスを持ち、そのパス上の車両の位置を照合するだけで十分です。ここで必要なのは、 SLAM分野のキーテクノロジー。
SLAM とは
SLAM (Simultaneous Localization and Mapping)、CML (Concurrent Mapping and Localization) とも呼ばれるリアルタイム測位マップの構築、またはマッピングと位置決めを同時に実行します。この問題は次のように説明できます: ロボットを未知の環境の未知の場所に置く場合、ロボットがどの方向に移動するかを決定しながら、環境の完全な地図を徐々に描画する方法はあるでしょうか?たとえば、掃除ロボットは非常に典型的な SLAM 問題であり、いわゆる完全なマップ (一貫したマップ) とは、ロボットが障害物なしに部屋のアクセス可能な隅々まで移動できることを意味します。
SLAM は、1988 年に Smith、Self、Cheeseman によって初めて提案されました。その重要な理論的および応用的価値により、多くの学者によって、真の完全自律移動ロボットを実現するための鍵であると考えられています。
模擬人間が見知らぬ環境に来たとき、すぐに環境に慣れて自分のタスク (レストランを探す、ホテルを探すなど) を完了するために、次のことを行う必要があります。
a. 周囲の建物、大木、花壇などのランドマークを目で観察し、その特徴を記憶します(特徴抽出)
#b. 双眼鏡で得た情報をもとに、自分の頭の中で特徴的なランドマークを三次元地図上に再構築する(三次元再構築)
#c. 歩行中は常に新しいフィーチャ ランドマークを取得し、頭の中でマップ モデルを修正します (バンドル調整または EKF)d. に基づいて位置 (軌道) を決定します。以前に歩いて得た地物ランドマーク
e. 意図せず遠くまで歩いてしまったときは、頭の中で以前のランドマークと照らし合わせて、元に戻っているかどうかを確認してくださいパス (ループ終了検出)。実際には、このステップはオプションです。上記の 5 つのステップは同時に実行されるため、同時ローカリゼーションとマッピングになります。
レーザー SLAM と視覚 SLAM
現在 SLAM で使用されているセンサーは、主に LIDAR とカメラの 2 つのカテゴリに分類されます。 LiDAR は、角度分解能と精度が異なるシングルライン タイプとマルチライン タイプに分類できます。
センサーは、変調された近赤外光を発し、物体に当たると反射し、発光と反射の時間差または位相差を計算して物体までの距離を換算します。撮影シーンを撮影して奥行き情報を生成します。レーダーと同様、またはコウモリを想像してください。softkinetic の DS325 は ToF ソリューション (TI によって設計) を使用します。ただし、受信機の微細構造は2枚以上のシャッターを備え、psレベルの時間差を測定できる比較的特殊な構造となっていますが、単位画素サイズが通常100umであるため、現状の分解能は高くありません。
SLAM 技術は非常に実用的ですが、非常に難しいものでもあり、常に正確な位置決めが必要な自動運転の分野では、 SLAMの実装を完了したいのですが、それも困難がいっぱいです。一般的に言えば、SLAM アルゴリズムは実装時に主に次の 4 つの側面を考慮します: 1. 密と疎のようなマップ表現の問題は、アルゴリズムの異なる表現です。 on 実際のシーンでは選択が必要; 2. 情報認識の問題、環境を包括的に認識する方法を考慮する必要がある 通常、RGBD カメラの FOV は小さいですが、LIDAR は大きいです。 3. データの関連付けの問題: センサーが異なれば、データ型、タイムスタンプ、座標系の式も異なるため、これらを均一に処理する必要があります。 4. 位置決めと合成の問題は、多くの数学的問題、物理モデルの確立、状態推定と最適化を含む姿勢推定とモデリングを達成する方法を指します。その他には、ループ検出問題、探索問題 (探索)、誘拐問題 (誘拐) が含まれます。 。 現在人気のあるビジュアル SLAM フレームワークには、主にフロントエンドとバックエンドが含まれています: フロントエンド #フロントエンドは、フレーム間の変換関係を研究する VO (ビジュアル オドメトリ) に相当します。 まず、各フレーム画像の特徴点を抽出し、隣接するフレーム画像を使用して特徴点をマッチングし、次にRANSACを使用して大きなノイズを除去し、マッチングを実行して姿勢情報を取得します(位置と姿勢)、同時に IMU (慣性測定ユニット) によって提供される姿勢情報をフィルタリングと融合に使用できます。バックエンドは主に、フィルタリング理論 (EKF) を使用してフロントエンドの結果を最適化します。 、UKF、PF)、または最適化理論 TORO、G2O ツリーまたはグラフの最適化を実行します。最後に、最適な姿勢推定値が取得されます。 バックエンド バックエンドには、より多くの困難があり、より多くの数学的知識が必要になります。一般的に、誰もが徐々に放棄してきました。従来のフィルタリング理論に基づいてグラフの最適化に移行しました。 フィルタリング理論に基づくと、フィルタの安定性があまりにも速く増加するため、頻繁な反転が必要な EKF (拡張カルマン フィルタ) の PF に多大な圧力がかかります。 グラフベースの SLAM は、通常、複数のノードとアフィン変換行列などのノード間の相対的な変換関係を確立するためのキーフレームに基づいており、キー ノードのメンテナンスは継続的に実行されます。グラフの容量を削減し、精度を確保しながら計算量を削減します。 Slam 技術は、多くの分野で優れた導入効果と成果を上げています。モバイルロボット、ARシーン、ドローンなど。自動運転の分野では、SLAM 技術はあまり注目されていませんが、一方で、現在の自動運転産業のほとんどは RTK によって解決されているため、詳細な研究にはあまり多くのリソースが投資されません。 , SLAM技術があまり注目されていないのは、現状の技術がまだ成熟していないからでもありますが、自動運転などの生活関連分野では、どんな新技術も実用化するには時間の試練を経なければなりません。受け入れられました。 将来的には、センサーの精度が徐々に向上し、低コストで自動運転の分野でもSLAMは才能を発揮します。堅牢性が自動運転に革新的な変化をもたらします。 SLAM 技術の普及が進むにつれ、測位の才能に恵まれた人材が自動運転の分野に流入し、自動運転に新たな血液が注入され、新たな技術的方向性や研究分野がもたらされるでしょう。
SLAM アルゴリズム実装の要素
自動運転分野における SLAM の将来の応用
以上が自動運転におけるSLAM技術の応用について論じた記事の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック









上記と著者の個人的な理解 3 次元ガウシアンプラッティング (3DGS) は、近年、明示的な放射線フィールドとコンピューター グラフィックスの分野で出現した革新的なテクノロジーです。この革新的な方法は、数百万の 3D ガウスを使用することを特徴とし、主に暗黙的な座標ベースのモデルを使用して空間座標をピクセル値にマッピングする神経放射線場 (NeRF) 方法とは大きく異なります。明示的なシーン表現と微分可能なレンダリング アルゴリズムにより、3DGS はリアルタイム レンダリング機能を保証するだけでなく、前例のないレベルの制御とシーン編集も導入します。これにより、3DGS は、次世代の 3D 再構築と表現にとって大きな変革をもたらす可能性のあるものとして位置付けられます。この目的を達成するために、私たちは 3DGS 分野における最新の開発と懸念について初めて体系的な概要を提供します。

昨日の面接で、ロングテール関連の質問をしたかと聞かれたので、簡単にまとめてみようと思いました。自動運転のロングテール問題とは、自動運転車におけるエッジケース、つまり発生確率が低い考えられるシナリオを指します。認識されているロングテール問題は、現在、単一車両のインテリジェント自動運転車の運用設計領域を制限している主な理由の 1 つです。自動運転の基礎となるアーキテクチャとほとんどの技術的問題は解決されており、残りの 5% のロングテール問題が徐々に自動運転の開発を制限する鍵となってきています。これらの問題には、さまざまな断片的なシナリオ、極端な状況、予測不可能な人間の行動が含まれます。自動運転におけるエッジ シナリオの「ロング テール」とは、自動運転車 (AV) におけるエッジ ケースを指します。エッジ ケースは、発生確率が低い可能性のあるシナリオです。これらの珍しい出来事

0.前面に書かれています&& 自動運転システムは、さまざまなセンサー (カメラ、ライダー、レーダーなど) を使用して周囲の環境を認識し、アルゴリズムとモデルを使用することにより、高度な知覚、意思決定、および制御テクノロジーに依存しているという個人的な理解リアルタイムの分析と意思決定に。これにより、車両は道路標識の認識、他の車両の検出と追跡、歩行者の行動の予測などを行うことで、安全な運行と複雑な交通環境への適応が可能となり、現在広く注目を集めており、将来の交通分野における重要な開発分野と考えられています。 。 1つ。しかし、自動運転を難しくしているのは、周囲で何が起こっているかを車に理解させる方法を見つけることです。これには、自動運転システムの 3 次元物体検出アルゴリズムが、周囲環境にある物体 (位置を含む) を正確に認識し、記述することができる必要があります。

これほど強力なAIの模倣能力では、それを防ぐことは本当に不可能です。 AIの発展は今ここまで進んでいるのか?前足で顔の特徴を浮き上がらせ、後ろ足で全く同じ表情を再現し、見つめたり、眉を上げたり、口をとがらせたり、どんなに大袈裟な表情でも完璧に真似しています。難易度を上げて、眉毛を高く上げ、目を大きく開き、口の形も歪んでいるなど、バーチャルキャラクターアバターで表情を完璧に再現できます。左側のパラメータを調整すると、右側の仮想アバターもそれに合わせて動きが変化し、口や目の部分がアップになります。同じです(右端)。この研究は、GaussianAvatars を提案するミュンヘン工科大学などの機関によるものです。

自動運転では軌道予測が重要な役割を果たしており、自動運転軌道予測とは、車両の走行過程におけるさまざまなデータを分析し、将来の車両の走行軌跡を予測することを指します。自動運転のコアモジュールとして、軌道予測の品質は下流の計画制御にとって非常に重要です。軌道予測タスクには豊富な技術スタックがあり、自動運転の動的/静的知覚、高精度地図、車線境界線、ニューラル ネットワーク アーキテクチャ (CNN&GNN&Transformer) スキルなどに精通している必要があります。始めるのは非常に困難です。多くのファンは、できるだけ早く軌道予測を始めて、落とし穴を避けたいと考えています。今日は、軌道予測に関するよくある問題と入門的な学習方法を取り上げます。関連知識の紹介 1. プレビュー用紙は整っていますか? A: まずアンケートを見てください。

原題: SIMPL: ASimpleandEfficientMulti-agentMotionPredictionBaselineforAutonomousDriving 論文リンク: https://arxiv.org/pdf/2402.02519.pdf コードリンク: https://github.com/HKUST-Aerial-Robotics/SIMPL 著者単位: 香港科学大学DJI 論文のアイデア: この論文は、自動運転車向けのシンプルで効率的な動作予測ベースライン (SIMPL) を提案しています。従来のエージェントセントとの比較

先頭と開始点に書かれている エンドツーエンドのパラダイムでは、統一されたフレームワークを使用して自動運転システムのマルチタスクを実現します。このパラダイムの単純さと明確さにも関わらず、サブタスクにおけるエンドツーエンドの自動運転手法のパフォーマンスは、依然としてシングルタスク手法に比べてはるかに遅れています。同時に、以前のエンドツーエンド手法で広く使用されていた高密度鳥瞰図 (BEV) 機能により、より多くのモダリティやタスクに拡張することが困難になります。ここでは、スパース検索中心のエンドツーエンド自動運転パラダイム (SparseAD) が提案されています。このパラダイムでは、スパース検索は、高密度の BEV 表現を使用せずに、空間、時間、タスクを含む運転シナリオ全体を完全に表します。具体的には、統合されたスパース アーキテクチャが、検出、追跡、オンライン マッピングなどのタスク認識のために設計されています。さらに、重い

この 1 か月間、いくつかのよく知られた理由により、私は業界のさまざまな教師やクラスメートと非常に集中的な交流をしてきました。この交換で避けられない話題は当然、エンドツーエンドと人気の Tesla FSDV12 です。この機会に、現時点での私の考えや意見を整理し、皆様のご参考とご議論に役立てたいと思います。エンドツーエンドの自動運転システムをどのように定義するか、またエンドツーエンドで解決することが期待される問題は何でしょうか?最も伝統的な定義によれば、エンドツーエンド システムとは、センサーから生の情報を入力し、関心のある変数をタスクに直接出力するシステムを指します。たとえば、画像認識では、従来の特徴抽出 + 分類子方式と比較して、CNN はエンドツーエンドと言えます。自動運転タスクでは、各種センサー(カメラ/LiDAR)からのデータを入力
