目次
24年目の新たな始まり
ホームページ テクノロジー周辺機器 AI BEVレーンラインの実装について少し

BEVレーンラインの実装について少し

Mar 06, 2024 am 11:31 AM
オートパイロット bev

#2021 年に種が蒔かれました

BEV 障害物のストーリーを読んだ学生は、私たちのグループが 10 月 21 日の資料の頃に BEV 障害物に取り組み始めたことを知っているはずです。当時は人手がなかったため、BEVの車線標示をやろうとは思いませんでした。しかし、12月頃に候補者と会ったのを覚えています。面接中に、彼らは半年以上前からBEV車線標示に取り組んでいたと聞きました。技術ルート全体が高架道路を介してBEV車線標示ネットワークとして使用されていました。精度の高いマップ。真の値をトレーニングし、効果は悪くないと言えます。残念ながら、その候補者は最終的に私たちのところに来ませんでした。 2021 年の Telsa AI Day で教えられた車線標示の内容と組み合わせることで、BEV 車線標示作成の種がグループに植えられました。

2022 年に正しい第一歩を踏み出しましょう
2022 年を通じて、私たちのチームの人員は非常に逼迫していました。6 月と 7 月はちょうど人員が足りたのを覚えています。 BEV 車線を探索します。しかし、当時、私たちのグループには、これを2か月以内に行う必要があるクラスメートは1人だけでした(今ではシャオシュアンと呼びましょう)。そして、2021年の種が芽を出し始めました。私たちはデータから始めるつもりでした。学生のXiaoxuanはまだとても上手でした(非常に想像力が豊かで、Xiaoxuanは将来、みんなを驚かせるようなものをもっと作りました)、そしてそれはほぼ使用されました。 、高速高精度地図を通じて、該当する車両の周囲の車線データを抽出できます。作った時はまだみんなすごく興奮していたのを覚えています。

BEVレーンラインの実装について少し

図 1: 画像システムに投影された高精度地図の車線の効果

図 1 からわかるように、まだいくつかの影響が残っています。フィッティングに問題があるため、Xiaoxuan は一連の最適化を行いました。 2 か月後、Xiaoxuan は別の仕事に就きましたが、今振り返ると、BEV 車線の探索において正しい一歩を踏み出したと言えます。なぜなら、2021年と22年に、多くの優れたBEVレーンラインペーパーとコードが徐々にオープンソース化されたからです。これを見ると、2023 年に BEV 車線を導入するという完璧なストーリーがあるはずだと思うかもしれません。しかし、理想は非常に充実していることがよくありますが、現実は非常に残酷です。

23 年間のつまずき

当社の BEV 障害物は、BEV がこの道を進むことができることを証明しており、路上テストでも良好な結果を示しているからです。グループは、車線境界線を検討するためのより多くのリソースを持ち始めました。これは BEV ではないことに注意してください。なぜ?というのも、当時はオンライン化へのプレッシャーが大きく、BEVレーンラインの経験も浅く、つまり2Dレーンラインを量産した人がグループ全体でほとんどいなかったからです。 。 2023 年上半期はまさに「つまずき」と言える状況で、社内で何度も白熱した議論を重ね、最終的に 2 つのラインを形成することを決定し、そのうちの 1 つは 2D レーンラインです。 2Dレーンラインを中心とした後処理、軽量モデル、2Dレーンラインによるレーンライン後処理量産経験の蓄積。 1 つのラインは BEV レーンラインです。人員が少なく (実際には 1 ~ 2 人のみ)、BEV レーンラインのモデル設計に重点を置き、モデルの経験を蓄積しています。 BEV 車線区画線ネットワークは既に数多く存在しますが、私たちに大きな影響を与えた 2 つの論文を参考までに掲載します。 「HDMapNet: オンライン HD マップ構築および評価フレームワーク」および「MapTR: オンライン ベクトル化 HD マップ構築のための構造化モデリングと学習」

BEVレーンラインの実装について少し

図 2: HDMapNet

BEVレーンラインの実装について少し

図 3 マップTR

幸いなことに、4 月と 5 月に、2D レーン ラインにおけるレーン ラインの後処理の量産で多くの経験を蓄積しました。車線ネットワークも設計され、5 月末にはすぐに BEV 車線がバスに設置されることに成功しました。ここで言わなければならないのは、レーンラインの後処理を担当するクラスメートの Dahai は依然として非常に有能であるということです。しかし、物事が順調に進んでいると思った瞬間に、悪夢が始まろうとしていることがよくあります。 BEV車線の導入後、車両制御効果は理想的ではありませんでした。この時、誰もが自信喪失の段階に陥っていました。BEV車線の3次スプラインフィッティングの問題のせいでしょうか、それとも適応不良の問題でしょうか。ダウンストリームパラメータの。幸いなことに、私たちの車にはサプライヤーの結果が保存されており、路上テスト中にサプライヤーの車線の結果を保存し、視覚化ツールの結果と比較しました。車両制御効果が良くない場合、下流のドライバーがBEVの車線に適応できるように、まず自分の車線の品質に問題がないことを証明する必要があります。クルマを安定してコントロールできるようになるまで、1か月、まるまる1か月かかりました。私たちも上海から蘇州まで走ったことをよく覚えていますが、その日はまだ土曜日で、高速車両の制御効果を見てグループ全員がとても興奮していました。

しかし、ストーリーには紆余曲折がつきもので、車線データは高速・高精度地図でしか作成できません。市をどうするか? 解決すべき悪質な事件がまだたくさんあります。このとき、いよいよ重要人物が登場しますが、クラスメイトのシャオタン(データグループの重鎮)と呼びましょう。クラスメイトのシャオタンと他の人たちは、点群再構成を使用してクリップを再構築してくれました ( このプロセスは非常に苦痛でした。この 2 か月間が彼らにとって最もストレスの多い時期だったことを覚えています (笑)。もちろん、クラスメートのシャオタンと私たちはよく衝突しました)愛し合って殺し合った。結局のところ、私は会議中に「またデータがない」とよく言います。)。では、再建後のラベルはどうするのかというと、当時のサプライヤーを見てみると、ラベルを貼る経験はおろか、そのようなラベルを貼るツールを持っている会社もありませんでした。 Xiaotang らと協力して、長い 1 か月を経て、サプライヤーとともに注釈ツールが最終的に完成しました。 (私たちは、自動運転アノテーション業界全体に力を与えているとよく冗談を言います。このプロセスは本当に苦痛で、クリップの再構築は読み込みに非常に時間がかかります)。しかし、全体のラベリングはまだ比較的時間がかかるか高価であり、この時点で、Xiaoxuan は車線事前ラベリングの大型モデルでデビューしました (車線事前ラベリングの大型モデルの効果は依然として顕著です)。驚いて彼を見た。この一連の組み合わせにより、ようやく車線データの作成がほぼ完了します。 8月には、BEVレーンライン制御レーンラインが十分に反復され、単純な高速操縦機能に適しています。今もXiaoxuanは大きなモデルの事前にマークされた方向で私たちにさらなる驚きをもたらしてくれます、私たちとXiaotangはまだお互いを愛しています。

しかし、話はそう簡単に終わりません。9 月に、マルチモーダル (ライダー、カメラ、レーダー) マルチタスク (車線、障害物、Occ) 融合前のモデルの開発に着手しました。その後、City Navigation (NCP)、つまり認識を重視し地図を無視するいわゆるソリューションもサポートする予定です。 BEV の障害物と BEV 車線の経験に基づいて、おそらく 9 月末までに車両に統合ネットワークを展開する予定です。道路標識認識、交差点トポロジーなど、多くのサブタスクが車線境界線にも追加されました。このプロセスでは、BEV 車線ラインの後処理をアップグレードし、車線ライン 3 次スプライン フィッティングを放棄し、ポイント トラッキング スキームを採用しました。ポイント トラッキング スキームの出力と車線ライン モデルを簡単に組み合わせることができます。このプロセスも苦痛で、2ヶ月連続で週に1回の臨時ミーティングを開催し、結局フィッティングプランに基づいて順調に進んできましたが、より高い限界に到達するには苦痛と喜びを味わうしかありません。最後に、私たちはすでに基本的な機能を路上テストに導入しています。

図 4 について簡単に説明します。左側は車線のポイント追跡の効果です。現在、モデルの知覚範囲は最初の 80 メートルのみです。後ろにいくつかのポイントがあることがわかります。追跡によって残された車。右側は私たちが確立したリアルタイムの知覚マップです もちろん、まだ急速な反復プロセスの途中であり、まだ多くの問題が解決されています。

24年目の新たな始まり

24年という年月を経て、21年から現在までの成長と蓄積を振り返るこの瞬間、私は本当に幸運でした。 21 年後にその時点に到達するために、私は BEV を行う機会に恵まれ、その過程で互いに助け合える志を同じくする友人のグループがいることが非常に幸運です。 24 年間、融合前のモデルの量産、データ方向の取り組み、タイミング モデルの探求、エンドツーエンドの想像力など、私たちが追求すべきことはたくさんあります。

以上がBEVレーンラインの実装について少しの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

なぜ自動運転ではガウス スプラッティングが非常に人気があるのに、NeRF は放棄され始めているのでしょうか? なぜ自動運転ではガウス スプラッティングが非常に人気があるのに、NeRF は放棄され始めているのでしょうか? Jan 17, 2024 pm 02:57 PM

上記と著者の個人的な理解 3 次元ガウシアンプラッティング (3DGS) は、近年、明示的な放射線フィールドとコンピューター グラフィックスの分野で出現した革新的なテクノロジーです。この革新的な方法は、数百万の 3D ガウスを使用することを特徴とし、主に暗黙的な座標ベースのモデルを使用して空間座標をピクセル値にマッピングする神経放射線場 (NeRF) 方法とは大きく異なります。明示的なシーン表現と微分可能なレンダリング アルゴリズムにより、3DGS はリアルタイム レンダリング機能を保証するだけでなく、前例のないレベルの制御とシーン編集も導入します。これにより、3DGS は、次世代の 3D 再構築と表現にとって大きな変革をもたらす可能性のあるものとして位置付けられます。この目的を達成するために、私たちは 3DGS 分野における最新の開発と懸念について初めて体系的な概要を提供します。

自動運転シナリオにおけるロングテール問題を解決するにはどうすればよいでしょうか? 自動運転シナリオにおけるロングテール問題を解決するにはどうすればよいでしょうか? Jun 02, 2024 pm 02:44 PM

昨日の面接で、ロングテール関連の質問をしたかと聞かれたので、簡単にまとめてみようと思いました。自動運転のロングテール問題とは、自動運転車におけるエッジケース、つまり発生確率が低い考えられるシナリオを指します。認識されているロングテール問題は、現在、単一車両のインテリジェント自動運転車の運用設計領域を制限している主な理由の 1 つです。自動運転の基礎となるアーキテクチャとほとんどの技術的問題は解決されており、残りの 5% のロングテール問題が徐々に自動運転の開発を制限する鍵となってきています。これらの問題には、さまざまな断片的なシナリオ、極端な状況、予測不可能な人間の行動が含まれます。自動運転におけるエッジ シナリオの「ロング テール」とは、自動運転車 (AV) におけるエッジ ケースを指します。エッジ ケースは、発生確率が低い可能性のあるシナリオです。これらの珍しい出来事

カメラかライダーを選択しますか?堅牢な 3D オブジェクト検出の実現に関する最近のレビュー カメラかライダーを選択しますか?堅牢な 3D オブジェクト検出の実現に関する最近のレビュー Jan 26, 2024 am 11:18 AM

0.前面に書かれています&& 自動運転システムは、さまざまなセンサー (カメラ、ライダー、レーダーなど) を使用して周囲の環境を認識し、アルゴリズムとモデルを使用することにより、高度な知覚、意思決定、および制御テクノロジーに依存しているという個人的な理解リアルタイムの分析と意思決定に。これにより、車両は道路標識の認識、他の車両の検出と追跡、歩行者の行動の予測などを行うことで、安全な運行と複雑な交通環境への適応が可能となり、現在広く注目を集めており、将来の交通分野における重要な開発分野と考えられています。 。 1つ。しかし、自動運転を難しくしているのは、周囲で何が起こっているかを車に理解させる方法を見つけることです。これには、自動運転システムの 3 次元物体検出アルゴリズムが、周囲環境にある物体 (位置を含む) を正確に認識し、記述することができる必要があります。

座標系の変換を本当にマスターしましたか?自動運転と切り離せないマルチセンサーの問題 座標系の変換を本当にマスターしましたか?自動運転と切り離せないマルチセンサーの問題 Oct 12, 2023 am 11:21 AM

最初のパイロットおよび重要な記事では、主に自動運転技術で一般的に使用されるいくつかの座標系と、それらの間の相関と変換を完了し、最終的に統合環境モデルを構築する方法を紹介します。ここでの焦点は、車両からカメラの剛体への変換 (外部パラメータ)、カメラから画像への変換 (内部パラメータ)、および画像からピクセル単位への変換を理解することです。 3D から 2D への変換には、対応する歪み、変換などが発生します。要点:車両座標系とカメラ本体座標系を平面座標系とピクセル座標系に書き換える必要がある 難易度:画像の歪みを考慮する必要がある 歪み補正と歪み付加の両方を画面上で補正する2. はじめに ビジョンシステムには、ピクセル平面座標系 (u, v)、画像座標系 (x, y)、カメラ座標系 ()、世界座標系 () の合計 4 つの座標系があります。それぞれの座標系には関係性があり、

自動運転と軌道予測についてはこの記事を読めば十分です! 自動運転と軌道予測についてはこの記事を読めば十分です! Feb 28, 2024 pm 07:20 PM

自動運転では軌道予測が重要な役割を果たしており、自動運転軌道予測とは、車両の走行過程におけるさまざまなデータを分析し、将来の車両の走行軌跡を予測することを指します。自動運転のコアモジュールとして、軌道予測の品質は下流の計画制御にとって非常に重要です。軌道予測タスクには豊富な技術スタックがあり、自動運転の動的/静的知覚、高精度地図、車線境界線、ニューラル ネットワーク アーキテクチャ (CNN&GNN&Transformer) スキルなどに精通している必要があります。始めるのは非常に困難です。多くのファンは、できるだけ早く軌道予測を始めて、落とし穴を避けたいと考えています。今日は、軌道予測に関するよくある問題と入門的な学習方法を取り上げます。関連知識の紹介 1. プレビュー用紙は整っていますか? A: まずアンケートを見てください。

SIMPL: 自動運転向けのシンプルで効率的なマルチエージェント動作予測ベンチマーク SIMPL: 自動運転向けのシンプルで効率的なマルチエージェント動作予測ベンチマーク Feb 20, 2024 am 11:48 AM

原題: SIMPL: ASimpleandEfficientMulti-agentMotionPredictionBaselineforAutonomousDriving 論文リンク: https://arxiv.org/pdf/2402.02519.pdf コードリンク: https://github.com/HKUST-Aerial-Robotics/SIMPL 著者単位: 香港科学大学DJI 論文のアイデア: この論文は、自動運転車向けのシンプルで効率的な動作予測ベースライン (SIMPL) を提案しています。従来のエージェントセントとの比較

エンドツーエンドおよび次世代の自動運転システムと、エンドツーエンドの自動運転に関する誤解について話しましょう。 エンドツーエンドおよび次世代の自動運転システムと、エンドツーエンドの自動運転に関する誤解について話しましょう。 Apr 15, 2024 pm 04:13 PM

この 1 か月間、いくつかのよく知られた理由により、私は業界のさまざまな教師やクラスメートと非常に集中的な交流をしてきました。この交換で避けられない話題は当然、エンドツーエンドと人気の Tesla FSDV12 です。この機会に、現時点での私の考えや意見を整理し、皆様のご参考とご議論に役立てたいと思います。エンドツーエンドの自動運転システムをどのように定義するか、またエンドツーエンドで解決することが期待される問題は何でしょうか?最も伝統的な定義によれば、エンドツーエンド システムとは、センサーから生の情報を入力し、関心のある変数をタスクに直接出力するシステムを指します。たとえば、画像認識では、従来の特徴抽出 + 分類子方式と比較して、CNN はエンドツーエンドと言えます。自動運転タスクでは、各種センサー(カメラ/LiDAR)からのデータを入力

nuScenes の最新 SOTA | SparseAD: スパース クエリは効率的なエンドツーエンドの自動運転に役立ちます。 nuScenes の最新 SOTA | SparseAD: スパース クエリは効率的なエンドツーエンドの自動運転に役立ちます。 Apr 17, 2024 pm 06:22 PM

先頭と開始点に書かれている エンドツーエンドのパラダイムでは、統一されたフレームワークを使用して自動運転システムのマルチタスクを実現します。このパラダイムの単純さと明確さにも関わらず、サブタスクにおけるエンドツーエンドの自動運転手法のパフォーマンスは、依然としてシングルタスク手法に比べてはるかに遅れています。同時に、以前のエンドツーエンド手法で広く使用されていた高密度鳥瞰図 (BEV) 機能により、より多くのモダリティやタスクに拡張することが困難になります。ここでは、スパース検索中心のエンドツーエンド自動運転パラダイム (SparseAD) が提案されています。このパラダイムでは、スパース検索は、高密度の BEV 表現を使用せずに、空間、時間、タスクを含む運転シナリオ全体を完全に表します。具体的には、統合されたスパース アーキテクチャが、検出、追跡、オンライン マッピングなどのタスク認識のために設計されています。さらに、重い

See all articles