目次
論文のアイデア:
ネットワーク設計:
引用:
ホームページ テクノロジー周辺機器 AI BEV におけるデータセット間のレーダーとカメラの融合に関する実験的研究

BEV におけるデータセット間のレーダーとカメラの融合に関する実験的研究

Oct 05, 2023 pm 06:45 PM
データ オートパイロット

原題: Cross-Dataset Experimental Study of Radar-Camera Fusion in Bird's-Eye View
論文リンク: https://arxiv.org/pdf/2309.15465.pdf
著者の所属: Opel Automobile GmbH Rheinland -ファルツィッシェ工科大学カイザースラウテルン ランダウ ドイツ人工知能研究センター

BEV下的Radar-Camera 融合跨数据集实验研究

論文のアイデア:

補完的なセンサー情報を活用することで、ミリメーターはウェーブレーダーとカメラフュージョンシステムは、高度な運転支援システムと自動運転機能に非常に堅牢で信頼性の高い認識システムを提供する可能性があります。カメラベースの物体検出の最近の進歩により、ミリ波レーダーとカメラの融合に新たな可能性がもたらされ、鳥瞰図の特徴マップを融合に活用できます。この研究では、新規で柔軟な融合ネットワークを提案し、2 つのデータセット (nuScenes と View-of-Delft) でそのパフォーマンスを評価します。実験結果によると、カメラ ブランチには大規模で多様なトレーニング データが必要ですが、ミリ波レーダー ブランチでは高性能ミリ波レーダーの恩恵がより多く得られます。この研究は転移学習を通じて、より小さなデータセットでのカメラのパフォーマンスを向上させます。研究結果はさらに、ミリ波レーダーとカメラの融合手法が、カメラのみまたはミリ波レーダーのみを使用するベースライン手法よりも大幅に優れていることを示しています。

ネットワーク設計:

##最近の 3D オブジェクト検出のトレンドは、画像の特徴を一般的な鳥瞰図 (BEV) 表現に変換することです。この表現は、複数のカメラ間で、または測距センサーを使用して融合できる、柔軟な融合アーキテクチャを提供します。この研究では、もともとレーザー カメラ フュージョンに使用されていた BEVFusion 手法をミリ波レーダー カメラ フュージョン用に拡張します。私たちは、選択したミリ波レーダー データセットを使用して、提案した融合手法をトレーニングし、評価しました。いくつかの実験で、各データセットの長所と短所について議論します。最後に、さらなる改善を達成するために転移学習を適用します

BEV下的Radar-Camera 融合跨数据集实验研究

#書き直す必要があるものは次のとおりです。 図1にBEVFusionに基づくBEVミリ波レーダーとカメラの融合フローチャートを示します。生成されたカメラ画像には、投影されたミリ波レーダーと実際のバウンディング ボックスの検出結果が含まれます。

この記事は、BEVFusion の融合アーキテクチャに従います。図 1 に、本稿での BEV におけるミリ波レーダーとカメラの融合のネットワーク概要を示します。カメラとミリ波レーダーのシグネチャが BEV で接続されると、融合が発生することに注意してください。この記事では、以下で各ブロックの詳細を説明します。

書き直す必要がある内容は次のとおりです。 A. カメラ エンコーダとカメラから BEV ビューへの変換

カメラ エンコーダとビュー変換は、[15] のアイデアを採用しています。柔軟なフレームワークは、任意のカメラの外部および内部パラメータの画像 BEV 特徴を抽出できます。まず、tiny-Swin Transformer ネットワークを使用して各画像から特徴が抽出されます。次に、この論文では、[14] の Lift および Splat ステップを使用して、画像の特徴を BEV 平面に変換します。この目的を達成するために、高密度深度予測の後に、特徴が擬似点群に変換され、ラスター化されて BEV グリッドに蓄積されるルールベースのブロックが続きます。

レーダー ピラー フィーチャ エンコーダ

このブロックの目的は、ミリ波レーダー点群を画像 BEV フィーチャと同じグリッド上の BEV フィーチャにエンコードすることです。この目的を達成するために、この論文では、[16] のピラー特徴エンコード技術を使用して、点群を無限の高さのボクセル、いわゆるピラーにラスタライズします。

書き換えが必要な内容は次のとおりです。 C. BEV エンコーダ

[5]と同様に、ミリ波レーダーとカメラの BEV 機能はカスケード フュージョンによって実現されます。融合された特徴は共同畳み込み BEV エンコーダーによって処理されるため、ネットワークは空間的な位置ずれを考慮し、異なるモダリティ間の相乗効果を活用できます。

D. 検出ヘッド

この記事では、CenterPoint 検出ヘッドを使用して予測を行います。各クラスのオブジェクト中心のヒートマップ。さらに回帰ヘッドは、オブジェクトのサイズ、回転、高さだけでなく、nuScenes の速度とクラス プロパティを予測します。ヒート マップはガウス焦点損失を使用してトレーニングされ、残りの検出ヘッドは L1 損失を使用してトレーニングされます。

実験結果:

BEV下的Radar-Camera 融合跨数据集实验研究

BEV下的Radar-Camera 融合跨数据集实验研究

##

引用:

Stäcker, L.、Heidenreich, P.、Rambach, J.、Stricker, D. (2023). 「鳥のレーダーとカメラの融合」 eye view" Cross-dataset Experimental Research". ArXiv. /abs/2309.15465

BEV下的Radar-Camera 融合跨数据集实验研究

書き直す必要がある内容は次のとおりです: 元のリンク; https://mp.weixin .qq.com/s/5mA5up5a4KJO2PBwUcuIdQ

以上がBEV におけるデータセット間のレーダーとカメラの融合に関する実験的研究の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

ddrescue を使用して Linux 上のデータを回復する ddrescue を使用して Linux 上のデータを回復する Mar 20, 2024 pm 01:37 PM

DDREASE は、ハード ドライブ、SSD、RAM ディスク、CD、DVD、USB ストレージ デバイスなどのファイル デバイスまたはブロック デバイスからデータを回復するためのツールです。あるブロック デバイスから別のブロック デバイスにデータをコピーし、破損したデータ ブロックを残して正常なデータ ブロックのみを移動します。 ddreasue は、回復操作中に干渉を必要としないため、完全に自動化された強力な回復ツールです。さらに、ddasue マップ ファイルのおかげでいつでも停止および再開できます。 DDREASE のその他の主要な機能は次のとおりです。 リカバリされたデータは上書きされませんが、反復リカバリの場合にギャップが埋められます。ただし、ツールに明示的に指示されている場合は切り詰めることができます。複数のファイルまたはブロックから単一のファイルにデータを復元します

オープンソース!ゾーイデプスを超えて! DepthFM: 高速かつ正確な単眼深度推定! オープンソース!ゾーイデプスを超えて! DepthFM: 高速かつ正確な単眼深度推定! Apr 03, 2024 pm 12:04 PM

0.この記事は何をするのですか?私たちは、多用途かつ高速な最先端の生成単眼深度推定モデルである DepthFM を提案します。従来の深度推定タスクに加えて、DepthFM は深度修復などの下流タスクでも最先端の機能を実証します。 DepthFM は効率的で、いくつかの推論ステップ内で深度マップを合成できます。この作品について一緒に読みましょう〜 1. 論文情報タイトル: DepthFM: FastMonocularDepthEstimationwithFlowMatching 著者: MingGui、JohannesS.Fischer、UlrichPrestel、PingchuanMa、Dmytr

自動運転シナリオにおけるロングテール問題を解決するにはどうすればよいでしょうか? 自動運転シナリオにおけるロングテール問題を解決するにはどうすればよいでしょうか? Jun 02, 2024 pm 02:44 PM

昨日の面接で、ロングテール関連の質問をしたかと聞かれたので、簡単にまとめてみようと思いました。自動運転のロングテール問題とは、自動運転車におけるエッジケース、つまり発生確率が低い考えられるシナリオを指します。認識されているロングテール問題は、現在、単一車両のインテリジェント自動運転車の運用設計領域を制限している主な理由の 1 つです。自動運転の基礎となるアーキテクチャとほとんどの技術的問題は解決されており、残りの 5% のロングテール問題が徐々に自動運転の開発を制限する鍵となってきています。これらの問題には、さまざまな断片的なシナリオ、極端な状況、予測不可能な人間の行動が含まれます。自動運転におけるエッジ シナリオの「ロング テール」とは、自動運転車 (AV) におけるエッジ ケースを指します。エッジ ケースは、発生確率が低い可能性のあるシナリオです。これらの珍しい出来事

Google は大喜び: JAX のパフォーマンスが Pytorch や TensorFlow を上回りました! GPU 推論トレーニングの最速の選択肢となる可能性があります Google は大喜び: JAX のパフォーマンスが Pytorch や TensorFlow を上回りました! GPU 推論トレーニングの最速の選択肢となる可能性があります Apr 01, 2024 pm 07:46 PM

Google が推進する JAX のパフォーマンスは、最近のベンチマーク テストで Pytorch や TensorFlow のパフォーマンスを上回り、7 つの指標で 1 位にランクされました。また、テストは最高の JAX パフォーマンスを備えた TPU では行われませんでした。ただし、開発者の間では、依然として Tensorflow よりも Pytorch の方が人気があります。しかし、将来的には、おそらくより大規模なモデルが JAX プラットフォームに基づいてトレーニングされ、実行されるようになるでしょう。モデル 最近、Keras チームは、ネイティブ PyTorch 実装を使用して 3 つのバックエンド (TensorFlow、JAX、PyTorch) をベンチマークし、TensorFlow を使用して Keras2 をベンチマークしました。まず、主流のセットを選択します

iPhoneのセルラーデータインターネット速度が遅い:修正 iPhoneのセルラーデータインターネット速度が遅い:修正 May 03, 2024 pm 09:01 PM

iPhone のモバイル データ接続に遅延や遅い問題が発生していませんか?通常、携帯電話の携帯インターネットの強度は、地域、携帯ネットワークの種類、ローミングの種類などのいくつかの要因によって異なります。より高速で信頼性の高いセルラー インターネット接続を実現するためにできることがいくつかあります。解決策 1 – iPhone を強制的に再起動する 場合によっては、デバイスを強制的に再起動すると、携帯電話接続を含む多くの機能がリセットされるだけです。ステップ 1 – 音量を上げるキーを 1 回押して放します。次に、音量小キーを押して、もう一度放します。ステップ 2 – プロセスの次の部分は、右側のボタンを押し続けることです。 iPhone の再起動が完了するまで待ちます。セルラーデータを有効にし、ネットワーク速度を確認します。もう一度確認してください 修正 2 – データ モードを変更する 5G はより優れたネットワーク速度を提供しますが、信号が弱い場合はより適切に機能します

超知性の生命力が覚醒する!しかし、自己更新 AI の登場により、母親はデータのボトルネックを心配する必要がなくなりました。 超知性の生命力が覚醒する!しかし、自己更新 AI の登場により、母親はデータのボトルネックを心配する必要がなくなりました。 Apr 29, 2024 pm 06:55 PM

世界は狂ったように大きなモデルを構築していますが、インターネット上のデータだけではまったく不十分です。このトレーニング モデルは「ハンガー ゲーム」のようであり、世界中の AI 研究者は、データを貪欲に食べる人たちにどのように餌を与えるかを心配しています。この問題は、マルチモーダル タスクで特に顕著です。何もできなかった当時、中国人民大学学部のスタートアップチームは、独自の新しいモデルを使用して、中国で初めて「モデル生成データフィード自体」を実現しました。さらに、これは理解側と生成側の 2 つの側面からのアプローチであり、両方の側で高品質のマルチモーダルな新しいデータを生成し、モデル自体にデータのフィードバックを提供できます。モデルとは何ですか? Awaker 1.0 は、中関村フォーラムに登場したばかりの大型マルチモーダル モデルです。チームは誰ですか?ソフォンエンジン。人民大学ヒルハウス人工知能大学院の博士課程学生、ガオ・イージャオ氏によって設立されました。

nuScenes の最新 SOTA | SparseAD: スパース クエリは効率的なエンドツーエンドの自動運転に役立ちます。 nuScenes の最新 SOTA | SparseAD: スパース クエリは効率的なエンドツーエンドの自動運転に役立ちます。 Apr 17, 2024 pm 06:22 PM

先頭と開始点に書かれている エンドツーエンドのパラダイムでは、統一されたフレームワークを使用して自動運転システムのマルチタスクを実現します。このパラダイムの単純さと明確さにも関わらず、サブタスクにおけるエンドツーエンドの自動運転手法のパフォーマンスは、依然としてシングルタスク手法に比べてはるかに遅れています。同時に、以前のエンドツーエンド手法で広く使用されていた高密度鳥瞰図 (BEV) 機能により、より多くのモダリティやタスクに拡張することが困難になります。ここでは、スパース検索中心のエンドツーエンド自動運転パラダイム (SparseAD) が提案されています。このパラダイムでは、スパース検索は、高密度の BEV 表現を使用せずに、空間、時間、タスクを含む運転シナリオ全体を完全に表します。具体的には、統合されたスパース アーキテクチャが、検出、追跡、オンライン マッピングなどのタスク認識のために設計されています。さらに、重い

アメリカ空軍が初のAI戦闘機を公開し注目を集める!大臣はプロセス全体を通じて干渉することなく個人的にテストを実施し、10万行のコードが21回にわたってテストされました。 アメリカ空軍が初のAI戦闘機を公開し注目を集める!大臣はプロセス全体を通じて干渉することなく個人的にテストを実施し、10万行のコードが21回にわたってテストされました。 May 07, 2024 pm 05:00 PM

最近、軍事界は、米軍戦闘機が AI を使用して完全自動空戦を完了できるようになったというニュースに圧倒されました。そう、つい最近、米軍のAI戦闘機が初めて公開され、その謎が明らかになりました。この戦闘機の正式名称は可変安定性飛行シミュレーター試験機(VISTA)で、アメリカ空軍長官が自ら飛行させ、一対一の空戦をシミュレートした。 5 月 2 日、フランク ケンダル米国空軍長官は X-62AVISTA でエドワーズ空軍基地を離陸しました。1 時間の飛行中、すべての飛行動作が AI によって自律的に完了されたことに注目してください。ケンダル氏は「過去数十年にわたり、私たちは自律型空対空戦闘の無限の可能性について考えてきたが、それは常に手の届かないものだと思われてきた」と語った。しかし今では、

See all articles