ScalableMap: オンラインで長距離ベクトル化された高精度地図構築のためのスケーラブルな地図学習
スケーラブル マップ: オンライン長距離ベクトル化 HD マップ構築のためのスケーラブル マップ学習
次のリンクをクリックして論文をお読みください: https://arxiv.org/pdf/2310.13378.pdf
コードリンク: https://github.com/jingy1yu/ScalableMap
著者のユニットは武漢大学です
論文のアイデア:
この論文では、車載カメラ センサーを使用してオンラインの長距離ベクトル化高精度 (HD) マップを構築するための新しいエンドツーエンド プロセスを提案します。高精度マップのベクトル化表現では、ポリラインとポリゴンを使用してマップ フィーチャを表現します。これらは下流のタスクで広く使用されています。ただし、動的ターゲット検出を参照して設計された以前のソリューションでは、線形マップ要素内の構造的制約が無視されていたため、長距離シーンでのパフォーマンス低下が生じていました。この記事では、マップ フィーチャの属性を使用して、マップ構築のパフォーマンスを向上させます。この論文では、線形構造の指導の下でより正確な鳥瞰図 (BEV) 特徴を抽出し、ベクトル化されたグラフ要素のスケーラビリティをさらに活用するための階層的スパース グラフ表現を提案し、この表現に基づいてプログレッシブ デコード メカニズムを設計します。 。この記事のメソッド ScalableMap は、nuScenes データセット上で、特に長距離シーンで優れたパフォーマンスを示しています。以前の最先端モデルと比較して、6.5 mAP 向上し、18.3 FPS
#Main貢献:
(i) この記事では、初のエンドツーエンドの長距離ベクトル マップ構築パイプラインである ScalableMap を提案します。この論文では、マッピング要素の構造的特徴を利用してより正確な BEV 特徴を抽出し、スケーラブルなベクトル化要素に基づく HSMR を提案し、それに応じてプログレッシブ デコーダと監視戦略を設計します。これらすべてにより、優れた長距離地図認識が実現します。 この研究では、広範な実験評価を通じて、nuScenes データセット [17] での ScalableMap のパフォーマンスをテストしました。この研究手法は、長距離高精度地図学習において最先端の結果を達成し、既存のマルチモーダル手法より 6.5 mAP 向上し、1 秒あたり 18.3 フレームの速度を達成しました。ネットワーク設計 :この記事の目標は、ベクトル化されたマップ要素の構造特性を活用して、長距離にわたってマップ要素を正確に検出するという課題に対処することです。まず、本論文は、2つの分岐を通じて位置認識BEV特徴とインスタンス認識BEV特徴をそれぞれ抽出し、線形構造の指導の下でそれらを融合してハイブリッドBEV特徴を取得する。次に、この論文は、疎であるが正確な方法でマップ要素を抽象化するための階層的疎マップ表現 (HSMR) を提案します。この表現を DETR [16] によって提案されたカスケード復号層と統合して、この論文は、ベクトル化されたマッピング要素のスケーラビリティと推論精度を向上させるプログレッシブ監視戦略を活用することによって、構造化情報の制約を強化するプログレッシブ デコーダを設計します。この記事のソリューションである ScalableMap は、マップのサンプリング密度を動的に高めてさまざまな縮尺で推論結果を取得するため、この記事はより正確なマップ情報をより迅速に取得できるようになります。
次の書き換えられた内容を参照してください。 図 1: ScalableMap の概要。 (a) 構造誘導型ハイブリッド BEV 特徴抽出器。 (b) 階層的スパース マップ表現とプログレッシブ デコーダ。 (c) 漸進的な監視元の意味を変えずに内容を書き直すには、元のテキストを中国語に書き直す必要があります
Yu, J.、Zhang, Z.、Xia、S.、Sang, J. (2023)。 ScalableMap: オンラインの長距離ベクトル化 HD マップ構築のためのスケーラブルなマップ学習。 ArXiv。 /abs/2310.13378
書き換える内容は、元の意味を変えずに書き換えます。書き換え言語は中国語です。元の文は不要です。
以上がScalableMap: オンラインで長距離ベクトル化された高精度地図構築のためのスケーラブルな地図学習の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

Video Face Swap
完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック











iPhone のデフォルトの地図は、Apple 独自の地理位置情報プロバイダーである Maps です。マップは改善されていますが、米国外ではうまく機能しません。 Googleマップと比べて何も提供するものはありません。この記事では、Google マップを iPhone のデフォルトの地図として使用するための実行可能な手順について説明します。 Google マップを iPhone のデフォルトの地図にする方法 Google マップを携帯電話のデフォルトの地図アプリとして設定するのは、思っているよりも簡単です。以下の手順に従ってください – 前提条件 – 携帯電話に Gmail がインストールされている必要があります。ステップ 1 – AppStore を開きます。ステップ 2 – 「Gmail」を検索します。ステップ 3 – Gmail アプリの横にある をクリックします

上記と著者の個人的な理解 3 次元ガウシアンプラッティング (3DGS) は、近年、明示的な放射線フィールドとコンピューター グラフィックスの分野で出現した革新的なテクノロジーです。この革新的な方法は、数百万の 3D ガウスを使用することを特徴とし、主に暗黙的な座標ベースのモデルを使用して空間座標をピクセル値にマッピングする神経放射線場 (NeRF) 方法とは大きく異なります。明示的なシーン表現と微分可能なレンダリング アルゴリズムにより、3DGS はリアルタイム レンダリング機能を保証するだけでなく、前例のないレベルの制御とシーン編集も導入します。これにより、3DGS は、次世代の 3D 再構築と表現にとって大きな変革をもたらす可能性のあるものとして位置付けられます。この目的を達成するために、私たちは 3DGS 分野における最新の開発と懸念について初めて体系的な概要を提供します。

昨日の面接で、ロングテール関連の質問をしたかと聞かれたので、簡単にまとめてみようと思いました。自動運転のロングテール問題とは、自動運転車におけるエッジケース、つまり発生確率が低い考えられるシナリオを指します。認識されているロングテール問題は、現在、単一車両のインテリジェント自動運転車の運用設計領域を制限している主な理由の 1 つです。自動運転の基礎となるアーキテクチャとほとんどの技術的問題は解決されており、残りの 5% のロングテール問題が徐々に自動運転の開発を制限する鍵となってきています。これらの問題には、さまざまな断片的なシナリオ、極端な状況、予測不可能な人間の行動が含まれます。自動運転におけるエッジ シナリオの「ロング テール」とは、自動運転車 (AV) におけるエッジ ケースを指します。エッジ ケースは、発生確率が低い可能性のあるシナリオです。これらの珍しい出来事

0.前面に書かれています&& 自動運転システムは、さまざまなセンサー (カメラ、ライダー、レーダーなど) を使用して周囲の環境を認識し、アルゴリズムとモデルを使用することにより、高度な知覚、意思決定、および制御テクノロジーに依存しているという個人的な理解リアルタイムの分析と意思決定に。これにより、車両は道路標識の認識、他の車両の検出と追跡、歩行者の行動の予測などを行うことで、安全な運行と複雑な交通環境への適応が可能となり、現在広く注目を集めており、将来の交通分野における重要な開発分野と考えられています。 。 1つ。しかし、自動運転を難しくしているのは、周囲で何が起こっているかを車に理解させる方法を見つけることです。これには、自動運転システムの 3 次元物体検出アルゴリズムが、周囲環境にある物体 (位置を含む) を正確に認識し、記述することができる必要があります。

自動運転では軌道予測が重要な役割を果たしており、自動運転軌道予測とは、車両の走行過程におけるさまざまなデータを分析し、将来の車両の走行軌跡を予測することを指します。自動運転のコアモジュールとして、軌道予測の品質は下流の計画制御にとって非常に重要です。軌道予測タスクには豊富な技術スタックがあり、自動運転の動的/静的知覚、高精度地図、車線境界線、ニューラル ネットワーク アーキテクチャ (CNN&GNN&Transformer) スキルなどに精通している必要があります。始めるのは非常に困難です。多くのファンは、できるだけ早く軌道予測を始めて、落とし穴を避けたいと考えています。今日は、軌道予測に関するよくある問題と入門的な学習方法を取り上げます。関連知識の紹介 1. プレビュー用紙は整っていますか? A: まずアンケートを見てください。

原題: SIMPL: ASimpleandEfficientMulti-agentMotionPredictionBaselineforAutonomousDriving 論文リンク: https://arxiv.org/pdf/2402.02519.pdf コードリンク: https://github.com/HKUST-Aerial-Robotics/SIMPL 著者単位: 香港科学大学DJI 論文のアイデア: この論文は、自動運転車向けのシンプルで効率的な動作予測ベースライン (SIMPL) を提案しています。従来のエージェントセントとの比較

この 1 か月間、いくつかのよく知られた理由により、私は業界のさまざまな教師やクラスメートと非常に集中的な交流をしてきました。この交換で避けられない話題は当然、エンドツーエンドと人気の Tesla FSDV12 です。この機会に、現時点での私の考えや意見を整理し、皆様のご参考とご議論に役立てたいと思います。エンドツーエンドの自動運転システムをどのように定義するか、またエンドツーエンドで解決することが期待される問題は何でしょうか?最も伝統的な定義によれば、エンドツーエンド システムとは、センサーから生の情報を入力し、関心のある変数をタスクに直接出力するシステムを指します。たとえば、画像認識では、従来の特徴抽出 + 分類子方式と比較して、CNN はエンドツーエンドと言えます。自動運転タスクでは、各種センサー(カメラ/LiDAR)からのデータを入力

目標検出は自動運転システムにおいて比較的成熟した問題であり、その中でも歩行者検出は最も初期に導入されたアルゴリズムの 1 つです。ほとんどの論文では非常に包括的な研究が行われています。ただし、サラウンドビューに魚眼カメラを使用した距離認識については、あまり研究されていません。放射状の歪みが大きいため、標準のバウンディング ボックス表現を魚眼カメラに実装するのは困難です。上記の説明を軽減するために、拡張バウンディング ボックス、楕円、および一般的な多角形の設計を極/角度表現に探索し、これらの表現を分析するためのインスタンス セグメンテーション mIOU メトリックを定義します。提案された多角形モデルの FisheyeDetNet は、他のモデルよりも優れたパフォーマンスを示し、同時に自動運転用の Valeo 魚眼カメラ データセットで 49.5% の mAP を達成しました。
