


Pembunuh pengeluaran besar-besaran! P-Mapnet: Menggunakan peta SDMap berketepatan rendah sebelum ini, prestasi pemetaan dipertingkatkan dengan hampir 20 mata!
Ditulis sebelum
Salah satu algoritma yang digunakan oleh sistem pemanduan autonomi semasa untuk menghilangkan pergantungannya pada peta berketepatan tinggi adalah untuk mengambil kesempatan daripada fakta bahawa prestasi persepsi dalam julat jarak jauh masih lemah. Untuk tujuan ini, kami mencadangkan P-MapNet, di mana "P" memfokuskan pada menggabungkan peta sebelum untuk meningkatkan prestasi model. Khususnya, kami mengeksploitasi maklumat terdahulu dalam SDMap dan HDMap: di satu pihak, kami mengekstrak data SDMap yang sejajar dengan lemah daripada OpenStreetMap dan mengekodkannya ke dalam istilah bebas untuk menyokong input. Terdapat masalah penjajaran yang lemah antara input yang diubah suai dengan ketat dan HD+Map sebenar Struktur kami berdasarkan mekanisme Cross-attention boleh memfokus secara adaptif pada rangka SDMap dan membawa peningkatan prestasi yang ketara, sebaliknya, kami mencadangkan kaedah yang digunakan MAE Untuk menangkap modul halus pengedaran terdahulu HDMap, modul ini membantu menjana pengedaran yang lebih konsisten dengan peta sebenar dan membantu mengurangkan kesan oklusi, artifak, dsb. Kami menjalankan pengesahan percubaan yang meluas pada set data nuScenes dan Argoverse2. .
(2) HDMap kami sebelum ini boleh meningkatkan indeks kesedaran peta sehingga 6.34%.
Semakan kerja berkaitan
(1)Penjanaan peta dalam talian
Penghasilan HD+Map terutamanya termasuk langkah seperti pemetaan SLAM, anotasi automatik dan anotasi manual. Ini menyebabkan kos yang tinggi dan kesegaran HD+Map yang terhad. Oleh itu, penjanaan peta dalam talian adalah penting untuk sistem pemanduan autonomi. HDMapNet mengekspresikan elemen peta melalui pengikatan dan menggunakan ramalan mengikut piksel dan kaedah pasca pemprosesan untuk mendapatkan hasil ramalan vektor. Beberapa kaedah terkini, seperti MapTR, PivotNet, Streammapnet, dsb., melaksanakan ramalan vektor hujung ke hujung berdasarkan seni bina Transformer Walau bagaimanapun, kaedah ini hanya menggunakan input sensor dan prestasinya masih terhad dalam persekitaran yang kompleks seperti oklusi dan cuaca yang melampau.
(2)Persepsi peta jarak jauh
Untuk menjadikan hasil yang dijana oleh peta dalam talian lebih baik digunakan oleh modul hiliran, beberapa kajian cuba mengembangkan lagi skop persepsi peta. SuperFusion[7] mencapai ramalan jarak jauh 90m ke hadapan dengan menggabungkan lidar dan kamera serta menggunakan transformasi BEV yang sedar mendalam. NeuralMapPrior[8] meningkatkan kualiti pemerhatian dalam talian semasa dan meluaskan skop persepsi dengan mengekalkan dan mengemas kini peta neural global. [6] memperoleh ciri BEV dengan mengagregatkan imej satelit dan data penderia kenderaan, dan seterusnya meramalkannya. MV-Map memfokuskan pada penjanaan peta jarak jauh luar talian Kaedah ini mengoptimumkan ciri BEV dengan mengagregatkan semua ciri bingkai yang berkaitan dan menggunakan medan sinaran saraf.Tinjauan keseluruhan P-MapNet
Rangka kerja keseluruhan ditunjukkan dalam Rajah 2.Rajah 2
Input:Input sistem ialah awan titik:
ialah bilangan kamera sekeliling. Tugas penjanaan HDMap biasa (seperti HDMapNet) boleh ditakrifkan sebagai: di mana mewakili pengekstrakan ciri, mewakili kepala segmentasi dan
ialah hasil ramalan HDMap.P-MapNet yang kami cadangkan menggabungkan Peta SD dan Peta HD sebelumnya. modul. Modul mempelajari pengedaran Peta HD sebelum melalui pra-latihan. Begitu juga, apabila hanya menggunakan SDMap sebelumnya, kami mendapat tetapan sahaja:
Output: Untuk tugas penjanaan peta, biasanya terdapat dua perwakilan peta: rasterisasi dan vektor. Dalam penyelidikan artikel ini, memandangkan dua modul a priori yang direka dalam artikel ini lebih sesuai untuk output raster, kami memberi tumpuan terutamanya pada perwakilan raster.
3.1 Modul Sebelum SDMap Penjanaan data SDMap Artikel ini menjalankan penyelidikan berdasarkan set data nuScenes dan Argoverse2, menggunakan data OpenStreetMap untuk menjana data SD Map dan melaksanakan kawasan set data yang sepadan di atas. transformasi sistem melalui GPS kenderaan Untuk mendapatkan Peta SD kawasan yang sepadan.
Pertanyaan BEV
Seperti yang ditunjukkan dalam Rajah 2, kami mula-mula melakukan pengekstrakan ciri dan penukaran perspektif pada data imej dan pengekstrakan ciri pada awan titik untuk mendapatkan ciri BEV. Kemudian ciri BEV diturunkan sampel melalui rangkaian konvolusi untuk mendapatkan ciri BEV baharu:, dan peta ciri diratakan untuk mendapatkan Pertanyaan BEV.
Peta SD gabungan sebelumnya
Untuk data Peta SD, selepas pengekstrakan ciri melalui rangkaian konvolusi, ciri yang diperolehi Mekanisme perhatian silang dengan Pertanyaan BEV:
BEV diperoleh selepas mekanisme perhatian silang Ciri-ciri diluluskan kepala pembahagian untuk mendapatkan ramalan awal elemen peta.
3.2 Modul HDMap Prior
secara langsung menggunakan Peta HD raster sebagai input MAE asal akan dilatih melalui MSE Loss, yang menjadikannya tidak boleh digunakan sebagai modul penghalusan. Jadi dalam artikel ini, kami menggantikan output MAE dengan kepala segmentasi kami. Untuk menjadikan elemen peta yang diramalkan mempunyai kesinambungan dan ketulenan (lebih dekat dengan pengedaran Peta HD sebenar), kami menggunakan modul MAE yang telah terlatih untuk diperhalusi. Latihan modul ini terdiri daripada dua langkah: langkah pertama ialah menggunakan pembelajaran penyeliaan kendiri untuk melatih modul MAE untuk mempelajari pengedaran Peta HD, dan langkah kedua ialah memperhalusi semua modul rangkaian dengan menggunakan pemberat yang diperolehi. dalam langkah pertama sebagai pemberat awal.
Dalam langkah pertama pra-latihan, Peta HD sebenar yang diperoleh daripada set data bertopeng secara rawak dan digunakan sebagai input rangkaian , dan matlamat latihan adalah untuk melengkapkan Peta HD:
Dalam yang kedua langkah memperhalusi, Berat yang telah dilatih dalam langkah pertama digunakan sebagai pemberat awal Rangkaian lengkap ialah:
4. Kami menjalankannya pada dua set data arus perdana Disemak: nuScenes dan Argoverse2. Untuk membuktikan keberkesanan kaedah cadangan kami pada jarak jauh, kami menetapkannya pada tiga jarak pengesanan berbeza:
,. Antaranya, peleraian Grid BEV dalam julat
ialah 0.15m, dan resolusi dalam dua julat yang lain ialah 0.3m. Kami menggunakan metrik mIOU untuk menilai keputusan ramalan raster dan mAP untuk menilai hasil ramalan vektor. Untuk menilai ketulenan peta, kami juga menggunakan metrik LPIPS sebagai metrik kesedaran peta.4.2 Keputusan Perbandingan dengan keputusan SOTA: Kami membandingkan hasil penjanaan peta kaedah yang dicadangkan dan kaedah SOTA semasa pada jarak dekat (60m × 30m) dan jarak jauh (90m × 30m). Seperti yang ditunjukkan dalam Jadual II, kaedah kami menunjukkan prestasi unggul berbanding kaedah penglihatan sahaja dan pelbagai mod (RGB+LiDAR) sedia ada.
Kami melakukan perbandingan prestasi dengan HDMapNet [14] pada jarak yang berbeza dan menggunakan mod sensor yang berbeza, dan hasilnya diringkaskan dalam Jadual I dan Jadual III. Kaedah kami mencapai 13.4% peningkatan pada mIOU dengan julat 240m × 60m. Memandangkan jarak yang dirasakan melebihi atau bahkan melebihi julat pengesanan sensor, keberkesanan SDMap sebelumnya menjadi lebih ketara, sekali gus mengesahkan keberkesanan SDMap sebelumnya. Akhir sekali, kami memanfaatkan peta HD sebelum membawa lagi peningkatan prestasi dengan memperhalusi hasil ramalan awal untuk menjadikannya lebih realistik dan menghapuskan keputusan palsu.
mempunyai peningkatan yang lebih besar daripada tetapan
sahaja.
Visualisasi:
Atas ialah kandungan terperinci Pembunuh pengeluaran besar-besaran! P-Mapnet: Menggunakan peta SDMap berketepatan rendah sebelum ini, prestasi pemetaan dipertingkatkan dengan hampir 20 mata!. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

AI Hentai Generator
Menjana ai hentai secara percuma.

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas



Ditulis di atas & pemahaman peribadi pengarang Gaussiansplatting tiga dimensi (3DGS) ialah teknologi transformatif yang telah muncul dalam bidang medan sinaran eksplisit dan grafik komputer dalam beberapa tahun kebelakangan ini. Kaedah inovatif ini dicirikan oleh penggunaan berjuta-juta Gaussians 3D, yang sangat berbeza daripada kaedah medan sinaran saraf (NeRF), yang terutamanya menggunakan model berasaskan koordinat tersirat untuk memetakan koordinat spatial kepada nilai piksel. Dengan perwakilan adegan yang eksplisit dan algoritma pemaparan yang boleh dibezakan, 3DGS bukan sahaja menjamin keupayaan pemaparan masa nyata, tetapi juga memperkenalkan tahap kawalan dan pengeditan adegan yang tidak pernah berlaku sebelum ini. Ini meletakkan 3DGS sebagai penukar permainan yang berpotensi untuk pembinaan semula dan perwakilan 3D generasi akan datang. Untuk tujuan ini, kami menyediakan gambaran keseluruhan sistematik tentang perkembangan dan kebimbangan terkini dalam bidang 3DGS buat kali pertama.

Semalam semasa temu bual, saya telah ditanya sama ada saya telah membuat sebarang soalan berkaitan ekor panjang, jadi saya fikir saya akan memberikan ringkasan ringkas. Masalah ekor panjang pemanduan autonomi merujuk kepada kes tepi dalam kenderaan autonomi, iaitu, kemungkinan senario dengan kebarangkalian yang rendah untuk berlaku. Masalah ekor panjang yang dirasakan adalah salah satu sebab utama yang kini mengehadkan domain reka bentuk pengendalian kenderaan autonomi pintar satu kenderaan. Seni bina asas dan kebanyakan isu teknikal pemanduan autonomi telah diselesaikan, dan baki 5% masalah ekor panjang secara beransur-ansur menjadi kunci untuk menyekat pembangunan pemanduan autonomi. Masalah ini termasuk pelbagai senario yang berpecah-belah, situasi yang melampau dan tingkah laku manusia yang tidak dapat diramalkan. "Ekor panjang" senario tepi dalam pemanduan autonomi merujuk kepada kes tepi dalam kenderaan autonomi (AVs) kes Edge adalah senario yang mungkin dengan kebarangkalian yang rendah untuk berlaku. kejadian yang jarang berlaku ini

0. Ditulis di hadapan&& Pemahaman peribadi bahawa sistem pemanduan autonomi bergantung pada persepsi lanjutan, membuat keputusan dan teknologi kawalan, dengan menggunakan pelbagai penderia (seperti kamera, lidar, radar, dll.) untuk melihat persekitaran sekeliling dan menggunakan algoritma dan model untuk analisis masa nyata dan membuat keputusan. Ini membolehkan kenderaan mengenali papan tanda jalan, mengesan dan menjejaki kenderaan lain, meramalkan tingkah laku pejalan kaki, dsb., dengan itu selamat beroperasi dan menyesuaikan diri dengan persekitaran trafik yang kompleks. Teknologi ini kini menarik perhatian meluas dan dianggap sebagai kawasan pembangunan penting dalam pengangkutan masa depan satu. Tetapi apa yang menyukarkan pemanduan autonomi ialah memikirkan cara membuat kereta itu memahami perkara yang berlaku di sekelilingnya. Ini memerlukan algoritma pengesanan objek tiga dimensi dalam sistem pemanduan autonomi boleh melihat dan menerangkan dengan tepat objek dalam persekitaran sekeliling, termasuk lokasinya,

Artikel perintis dan utama pertama terutamanya memperkenalkan beberapa sistem koordinat yang biasa digunakan dalam teknologi pemanduan autonomi, dan cara melengkapkan korelasi dan penukaran antara mereka, dan akhirnya membina model persekitaran bersatu. Fokus di sini adalah untuk memahami penukaran daripada kenderaan kepada badan tegar kamera (parameter luaran), penukaran kamera kepada imej (parameter dalaman) dan penukaran unit imej kepada piksel. Penukaran daripada 3D kepada 2D akan mempunyai herotan, terjemahan, dsb. Perkara utama: Sistem koordinat kenderaan dan sistem koordinat badan kamera perlu ditulis semula: sistem koordinat satah dan sistem koordinat piksel Kesukaran: herotan imej mesti dipertimbangkan Kedua-dua penyahherotan dan penambahan herotan diberi pampasan pada satah imej. 2. Pengenalan Terdapat empat sistem penglihatan secara keseluruhannya: sistem koordinat satah piksel (u, v), sistem koordinat imej (x, y), sistem koordinat kamera () dan sistem koordinat dunia (). Terdapat hubungan antara setiap sistem koordinat,

Ramalan trajektori memainkan peranan penting dalam pemanduan autonomi Ramalan trajektori pemanduan autonomi merujuk kepada meramalkan trajektori pemanduan masa hadapan kenderaan dengan menganalisis pelbagai data semasa proses pemanduan kenderaan. Sebagai modul teras pemanduan autonomi, kualiti ramalan trajektori adalah penting untuk kawalan perancangan hiliran. Tugas ramalan trajektori mempunyai timbunan teknologi yang kaya dan memerlukan kebiasaan dengan persepsi dinamik/statik pemanduan autonomi, peta ketepatan tinggi, garisan lorong, kemahiran seni bina rangkaian saraf (CNN&GNN&Transformer), dll. Sangat sukar untuk bermula! Ramai peminat berharap untuk memulakan ramalan trajektori secepat mungkin dan mengelakkan perangkap Hari ini saya akan mengambil kira beberapa masalah biasa dan kaedah pembelajaran pengenalan untuk ramalan trajektori! Pengetahuan berkaitan pengenalan 1. Adakah kertas pratonton teratur? A: Tengok survey dulu, hlm

Tajuk asal: SIMPL: ASimpleandEfficientMulti-agentMotionPredictionBaselineforAutonomousDriving Paper pautan: https://arxiv.org/pdf/2402.02519.pdf Pautan kod: https://github.com/HKUST-Aerial-Robotics/SIMPL Unit pengarang: Universiti Sains Hong Kong dan Teknologi Idea Kertas DJI: Kertas kerja ini mencadangkan garis dasar ramalan pergerakan (SIMPL) yang mudah dan cekap untuk kenderaan autonomi. Berbanding dengan agen-sen tradisional

Ditulis di hadapan & titik permulaan Paradigma hujung ke hujung menggunakan rangka kerja bersatu untuk mencapai pelbagai tugas dalam sistem pemanduan autonomi. Walaupun kesederhanaan dan kejelasan paradigma ini, prestasi kaedah pemanduan autonomi hujung ke hujung pada subtugas masih jauh ketinggalan berbanding kaedah tugasan tunggal. Pada masa yang sama, ciri pandangan mata burung (BEV) padat yang digunakan secara meluas dalam kaedah hujung ke hujung sebelum ini menyukarkan untuk membuat skala kepada lebih banyak modaliti atau tugasan. Paradigma pemanduan autonomi hujung ke hujung (SparseAD) tertumpu carian jarang dicadangkan di sini, di mana carian jarang mewakili sepenuhnya keseluruhan senario pemanduan, termasuk ruang, masa dan tugas, tanpa sebarang perwakilan BEV yang padat. Khususnya, seni bina jarang bersatu direka bentuk untuk kesedaran tugas termasuk pengesanan, penjejakan dan pemetaan dalam talian. Di samping itu, berat

Pengesanan objek ialah masalah yang agak matang dalam sistem pemanduan autonomi, antaranya pengesanan pejalan kaki adalah salah satu algoritma terawal untuk digunakan. Penyelidikan yang sangat komprehensif telah dijalankan dalam kebanyakan kertas kerja. Walau bagaimanapun, persepsi jarak menggunakan kamera fisheye untuk pandangan sekeliling agak kurang dikaji. Disebabkan herotan jejari yang besar, perwakilan kotak sempadan standard sukar dilaksanakan dalam kamera fisheye. Untuk mengurangkan perihalan di atas, kami meneroka kotak sempadan lanjutan, elips dan reka bentuk poligon am ke dalam perwakilan kutub/sudut dan mentakrifkan metrik mIOU pembahagian contoh untuk menganalisis perwakilan ini. Model fisheyeDetNet yang dicadangkan dengan bentuk poligon mengatasi model lain dan pada masa yang sama mencapai 49.5% mAP pada set data kamera fisheye Valeo untuk pemanduan autonomi
