Jadual Kandungan
Ditulis di hadapan & pemahaman peribadi pengarang
main Sumbangan-Sumbangan Bekas Fusion Kekecoh korelasi menggunakan anggaran halaju daripada radar gelombang milimeter.
Disebabkan penulis menjalankan keseluruhan model pada komputer dengan kad grafik 3090, ia dipanggil model terhad. Bahagian pengesanan sasaran model menggunakan BEVDet sebagai garis dasar pengesanan, tulang belakang pengekodan imej ialah ResNet50 dan input imej ditetapkan kepada (3×256×704 maklumat imej masa lalu atau masa hadapan tidak digunakan dalam model dan saiz kelompok ditetapkan kepada 8. Untuk mengurangkan kekurangan data Radar, lima imbasan digunakan untuk meningkatkan data. Tiada maklumat temporal tambahan digunakan dalam model gabungan.
Hasil pengesanan objek
Kesimpulan
Rumah Peranti teknologi AI Di luar BEVFormer! CR3DT: Gabungan RV membantu pengesanan 3D & penjejakan SOTA (ETH) baharu

Di luar BEVFormer! CR3DT: Gabungan RV membantu pengesanan 3D & penjejakan SOTA (ETH) baharu

Apr 24, 2024 pm 06:07 PM
radar pemeriksaan 3d

Ditulis di hadapan & pemahaman peribadi pengarang

Artikel ini memperkenalkan kaedah gabungan radar gelombang kamera-milimeter (CR3DT) untuk pengesanan sasaran 3D dan penjejakan berbilang sasaran. Kaedah berasaskan lidar telah menetapkan piawaian yang tinggi untuk bidang ini, tetapi kuasa pengkomputeran yang tinggi dan kos yang tinggi telah menyekat pembangunan penyelesaian ini dalam bidang pemanduan autonomi pengesanan sasaran dan penyelesaian penjejakan 3D adalah disebabkan oleh tingginya kos Ia agak rendah dan telah menarik perhatian ramai sarjana, tetapi disebabkan keputusannya yang kurang baik. Oleh itu, gabungan kamera dan radar gelombang milimeter menjadi penyelesaian yang menjanjikan. Di bawah rangka kerja kamera sedia ada BEVDet, pengarang menggabungkan maklumat spatial dan halaju radar gelombang milimeter dan menggabungkannya dengan kepala pengesan CC-3DT++ untuk meningkatkan ketepatan pengesanan dan penjejakan sasaran 3D dengan ketara serta meneutralkan percanggahan antara prestasi dan kos.

main Sumbangan-Sumbangan Bekas Fusion Kekecoh korelasi menggunakan anggaran halaju daripada radar gelombang milimeter.

Penilaian Prestasi Pengesanan CR3DT mencapai 35.1% mAP dan 45.6% Skor Pengesanan nuScenes (NDS) pada set pengesahan pengesanan 3D nuScenes. Mengambil kesempatan daripada maklumat halaju kaya yang terkandung dalam data radar, ralat halaju purata pengesan (mAVE) dikurangkan sebanyak 45.3% berbanding pengesan kamera SOTA.

Penilaian Prestasi Penjejakan CR3DT mencapai prestasi penjejakan sebanyak 38.1% AMOTA pada set pengesahan penjejakan nuScenes, peningkatan AMOTA sebanyak 14.9% berbanding model penjejakan SOTA kamera sahaja, penggunaan eksplisit maklumat halaju trek dan Penambahbaikan selanjutnya telah mengurangkan bilangan IDS dengan ketara sebanyak kira-kira 43%.

Seni bina modelKaedah ini berdasarkan rangka kerja EV-Det, menggabungkan maklumat spatial dan halaju RADAR, dan digabungkan dengan kepala pengesan CC-3DT++, yang secara eksplisit menggunakan pengesan dipertingkatkan radar gelombang milimeter dalam perkaitan datanya, yang akhirnya membolehkan pengesanan dan penjejakan sasaran 3D.

Rajah 1 Keseluruhan seni bina. Pengesanan dan penjejakan masing-masing diserlahkan dalam warna biru muda dan hijau.

Penderia gabungan dalam ruang BEV

Modul ini menggunakan kaedah gabungan yang serupa dengan PointPillars, termasuk pengagregatan dan sambungan di dalamnya. Grid BEV ditetapkan kepada [-51.2, 51.2] dengan resolusi 0.8, menghasilkan grid ciri (128×128). Unjurkan ciri imej terus ke dalam ruang BEV Bilangan saluran setiap unit grid ialah 64, dan kemudian ciri BEV imej adalah (64×128×128 sama, maklumat 18 dimensi Radar diagregatkan ke dalam setiap In unit grid, ini termasuk koordinat x, y dan z bagi titik itu, dan tiada peningkatan dibuat pada data Radar. Penulis mengesahkan bahawa awan titik Radar sudah mengandungi lebih banyak maklumat daripada awan titik LiDAR, jadi ciri Radar BEV ialah (18×128×128). Akhir sekali, ciri BEV imej (64×128×128) dan ciri Radar BEV (18×128×128) disambungkan terus ((64+18)×128×128) sebagai input lapisan pengekodan ciri BEV. Dalam eksperimen ablasi seterusnya, didapati bahawa adalah berfaedah untuk menambah sambungan baki pada output lapisan pengekodan ciri BEV dengan dimensi (256×128×128), menghasilkan saiz input akhir kepala pengesanan CenterPoint sebanyak ( (256+18 )×128×128). . Semasa proses latihan, vektor pembenaman ciri visual satu dimensi diperoleh melalui pembelajaran kontras positif multivariat seakan-akan, dan kemudian pengesanan dan pembenaman ciri digunakan secara serentak dalam peringkat penjejakan CC-3DT. Langkah perkaitan data (modul DA dalam Rajah 1) telah diubah suai untuk memanfaatkan pengesanan kedudukan CR3DT yang dipertingkatkan dan anggaran halaju. Butirannya adalah seperti berikut: Di luar BEVFormer! CR3DT: Gabungan RV membantu pengesanan 3D & penjejakan SOTA (ETH) baharu

Eksperimen dan keputusan

telah diselesaikan berdasarkan set data nuScenes, dan semua latihan tidak menggunakan CBGS. Di luar BEVFormer! CR3DT: Gabungan RV membantu pengesanan 3D & penjejakan SOTA (ETH) baharu

Model terhad

Disebabkan penulis menjalankan keseluruhan model pada komputer dengan kad grafik 3090, ia dipanggil model terhad. Bahagian pengesanan sasaran model menggunakan BEVDet sebagai garis dasar pengesanan, tulang belakang pengekodan imej ialah ResNet50 dan input imej ditetapkan kepada (3×256×704 maklumat imej masa lalu atau masa hadapan tidak digunakan dalam model dan saiz kelompok ditetapkan kepada 8. Untuk mengurangkan kekurangan data Radar, lima imbasan digunakan untuk meningkatkan data. Tiada maklumat temporal tambahan digunakan dalam model gabungan.

Untuk pengesanan sasaran, gunakan skor mAP, NDS dan mAVE untuk menilai untuk penjejakan, gunakan AMOTA, AMOTP dan IDS untuk menilai.

Hasil pengesanan objek

Di luar BEVFormer! CR3DT: Gabungan RV membantu pengesanan 3D & penjejakan SOTA (ETH) baharu

Jadual 1 Keputusan pengesanan pada set pengesahan nuScenes

Jadual 1 menunjukkan prestasi pengesanan CR3DT berbanding dengan seni bina garis dasar BEVDet (R50) menggunakan kamera sahaja. Jelas sekali bahawa penambahan Radar meningkatkan prestasi pengesanan dengan ketara. Di bawah kekangan resolusi kecil dan rangka masa, CR3DT berjaya mencapai 5.3% peningkatan mAP dan 7.7% NDS berbanding BEVDet kamera sahaja. Walau bagaimanapun, disebabkan oleh had dalam kuasa pengkomputeran, kertas itu tidak mencapai keputusan percubaan resolusi tinggi, maklumat masa penggabungan, dsb. Selain itu, masa inferens juga diberikan dalam lajur terakhir Jadual 1.

Di luar BEVFormer! CR3DT: Gabungan RV membantu pengesanan 3D & penjejakan SOTA (ETH) baharu

Jadual 2 Eksperimen ablasi rangka kerja pengesanan

Dalam Jadual 2, kesan seni bina gabungan yang berbeza pada penunjuk pengesanan dibandingkan. Kaedah gabungan di sini dibahagikan kepada dua jenis: yang pertama disebut dalam kertas, yang meninggalkan voxelization z-dimensi dan konvolusi 3D seterusnya, dan secara langsung mengagregatkan ciri imej yang dipertingkatkan dan data RADAR tulen ke dalam lajur, dengan itu memperoleh Saiz ciri yang diketahui ialah ((64+18)×128×128); yang satu lagi ialah untuk mengeluarkan ciri imej yang dipertingkatkan dan data RADAR tulen ke dalam kiub dengan saiz 0.8×0.8×0.8 m untuk mendapatkan ciri alternatif Saiznya ialah ((64+). 18) × 10 × 128 × 128), jadi modul pemampat BEV perlu digunakan dalam bentuk lilitan 3D. Seperti yang dapat dilihat daripada Jadual 2(a), peningkatan dalam bilangan pemampat BEV akan membawa kepada penurunan prestasi, dan dapat dilihat bahawa penyelesaian pertama berprestasi lebih baik. Ia juga boleh dilihat daripada Jadual 2(b) bahawa menambah blok baki data Radar juga boleh meningkatkan prestasi, yang juga mengesahkan apa yang disebutkan dalam seni bina model sebelumnya Menambah sambungan baki pada output lapisan pengekodan ciri BEV adalah faedah .

Di luar BEVFormer! CR3DT: Gabungan RV membantu pengesanan 3D & penjejakan SOTA (ETH) baharuJadual 3 Hasil penjejakan pada set pengesahan nuScenes berdasarkan konfigurasi yang berbeza bagi garis dasar BEVDet dan CR3DT

Jadual 3 menunjukkan hasil penjejakan model penjejakan CC3DT++ yang dipertingkatkan pada set pengesahan nuScenes pada garis dasar dan Prestasi pada model pengesanan CR3DT. Model CR3DT meningkatkan prestasi AMOTA sebanyak 14.9% berbanding garis dasar dan menurunkannya sebanyak 0.11 m dalam AMOTP. Tambahan pula, dapat dilihat bahawa IDS berkurangan kira-kira 43% berbanding garis dasar.

Di luar BEVFormer! CR3DT: Gabungan RV membantu pengesanan 3D & penjejakan SOTA (ETH) baharu

Jadual 4 Penjejakan eksperimen ablasi seni bina yang dilakukan pada tulang belakang pengesanan CR3DT

Di luar BEVFormer! CR3DT: Gabungan RV membantu pengesanan 3D & penjejakan SOTA (ETH) baharu

Kesimpulan

Kerja ini mencadangkan model gabungan kamera-radar 3D, pengesanan objek yang cekap dan berkesan untuk gabungan radar CR3D secara spesifik Dengan menyepadukan data Radar ke dalam seni bina BEVDet kamera sahaja dan memperkenalkan seni bina penjejakan CC-3DT++, CR3DT telah meningkatkan dengan ketara pengesanan sasaran 3D dan ketepatan penjejakan, dengan mAP dan AMOTA meningkat masing-masing sebanyak 5.35% dan 14.9%.

Penyelesaian penyepaduan kamera dan radar gelombang milimeter mempunyai kelebihan kos rendah berbanding LiDAR tulen atau penyelesaian penyepaduan LiDAR dan kamera, dan hampir dengan perkembangan semasa kenderaan autonomi. Di samping itu, radar gelombang milimeter mempunyai kelebihan untuk menjadi teguh dalam cuaca buruk dan boleh menghadapi pelbagai senario aplikasi Masalah besar semasa ialah jarang awan titik radar gelombang milimeter dan ketidakupayaan untuk mengesan maklumat ketinggian. Walau bagaimanapun, dengan pembangunan berterusan radar gelombang milimeter 4D, saya percaya bahawa penyepaduan masa depan kamera dan penyelesaian radar gelombang milimeter akan mencapai tahap yang lebih tinggi dan mencapai hasil yang lebih baik!

Atas ialah kandungan terperinci Di luar BEVFormer! CR3DT: Gabungan RV membantu pengesanan 3D & penjejakan SOTA (ETH) baharu. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Tetapan grafik terbaik
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Cara Membuka Segala -galanya Di Myrise
4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Memahami imej 4K HD dengan mudah! Model berbilang modal besar ini secara automatik menganalisis kandungan poster web, menjadikannya sangat mudah untuk pekerja. Memahami imej 4K HD dengan mudah! Model berbilang modal besar ini secara automatik menganalisis kandungan poster web, menjadikannya sangat mudah untuk pekerja. Apr 23, 2024 am 08:04 AM

Model besar yang boleh menganalisis kandungan PDF, halaman web, poster dan carta Excel secara automatik tidak terlalu mudah untuk pekerja. Model InternLM-XComposer2-4KHD (disingkat IXC2-4KHD) yang dicadangkan oleh Shanghai AILab, Universiti China Hong Kong dan institusi penyelidikan lain menjadikan perkara ini menjadi kenyataan. Berbanding dengan model besar berbilang modal lain yang mempunyai had resolusi tidak lebih daripada 1500x1500, kerja ini meningkatkan imej input maksimum model besar berbilang mod kepada lebih resolusi 4K (3840x1600) dan menyokong sebarang nisbah aspek dan 336 piksel kepada 4K Perubahan resolusi dinamik. Tiga hari selepas dikeluarkan, model itu mengungguli senarai populariti model menjawab soalan visual HuggingFace. Mudah dikendalikan

CVPR 2024 |. Model penyebaran Lidar untuk penjanaan pemandangan fotorealistik CVPR 2024 |. Model penyebaran Lidar untuk penjanaan pemandangan fotorealistik Apr 24, 2024 pm 04:28 PM

Tajuk asal: TowardsRealisticSceneGenerationwithLiDARDiffusionModels Pautan kertas: https://hancyran.github.io/assets/paper/lidar_diffusion.pdf Pautan kod: https://lidar-diffusion.github.io Gabungan pengarang: CMU Toyota Research Institute University of Southern California Paper idea : Model resapan (DM) cemerlang dalam sintesis imej fotorealistik, tetapi menyesuaikannya kepada penjanaan pemandangan lidar memberikan cabaran yang ketara. Ini terutamanya kerana DM yang beroperasi di ruang titik mengalami kesukaran

Prestasi gabungan RV sangat mengagumkan! RCBEVDet: Radar juga mempunyai musim bunga, SOTA terkini! Prestasi gabungan RV sangat mengagumkan! RCBEVDet: Radar juga mempunyai musim bunga, SOTA terkini! Apr 02, 2024 am 11:49 AM

Ditulis di atas & pemahaman peribadi penulis ialah isu utama yang difokuskan oleh kertas perbincangan ini ialah penerapan teknologi pengesanan sasaran 3D dalam proses pemanduan autonomi. Walaupun pembangunan teknologi kamera penglihatan alam sekitar menyediakan maklumat semantik resolusi tinggi untuk pengesanan objek 3D, kaedah ini dihadkan oleh isu seperti ketidakupayaan untuk menangkap maklumat kedalaman dengan tepat dan prestasi buruk dalam cuaca buruk atau keadaan cahaya malap. Sebagai tindak balas kepada masalah ini, perbincangan mencadangkan kaedah pengesanan sasaran 3D berbilang mod baharu-RCBEVDet yang menggabungkan kamera pandangan sekeliling dan penderia radar gelombang milimeter yang menjimatkan. Kaedah ini menyediakan maklumat semantik yang lebih kaya dan penyelesaian kepada masalah seperti prestasi buruk dalam cuaca buruk atau keadaan cahaya malap dengan menggunakan maklumat daripada berbilang penderia secara menyeluruh. Untuk menangani isu ini, perbincangan mencadangkan kaedah yang menggabungkan kamera pandangan sekeliling

Idea baharu untuk simulasi LiDAR | LidarDM: Membantu menjana dunia 4D, pembunuh simulasi~ Idea baharu untuk simulasi LiDAR | LidarDM: Membantu menjana dunia 4D, pembunuh simulasi~ Apr 12, 2024 am 11:46 AM

Tajuk asal: LidarDM: GenerativeLiDARSimulationinaGeneratedWorld Paper pautan: https://arxiv.org/pdf/2404.02903.pdf Pautan kod: https://github.com/vzyrianov/lidardm Gabungan pengarang: Universiti Illinois, Massachusetts Institute of Technology Idea kertas: Pengenalan kepada artikel ini LidarDM, model penjanaan lidar novel yang mampu menghasilkan video lidar yang realistik, sedar reka letak, boleh dipercayai secara fizikal dan koheren dari segi masa. LidarDM mempunyai dua keupayaan yang belum pernah berlaku sebelum ini dalam pemodelan generatif lidar: (1)

Di luar BEVFormer! CR3DT: Gabungan RV membantu pengesanan 3D & penjejakan SOTA (ETH) baharu Di luar BEVFormer! CR3DT: Gabungan RV membantu pengesanan 3D & penjejakan SOTA (ETH) baharu Apr 24, 2024 pm 06:07 PM

Ditulis di atas & pemahaman peribadi pengarang Artikel ini memperkenalkan kaedah gabungan radar gelombang kamera-milimeter (CR3DT) untuk pengesanan sasaran 3D dan penjejakan berbilang sasaran. Kaedah berasaskan lidar telah menetapkan piawaian yang tinggi untuk bidang ini, tetapi kuasa pengkomputeran yang tinggi dan kos yang tinggi telah menyekat pembangunan penyelesaian ini dalam bidang pemanduan autonomi pengesanan sasaran dan penyelesaian penjejakan 3D adalah disebabkan oleh tingginya kos Ia agak rendah dan telah menarik perhatian ramai sarjana, tetapi disebabkan keputusannya yang kurang baik. Oleh itu, gabungan kamera dan radar gelombang milimeter menjadi penyelesaian yang menjanjikan. Di bawah rangka kerja kamera sedia ada BEVDet, pengarang menggabungkan maklumat spatial dan halaju radar gelombang milimeter dan menggabungkannya dengan kepala pengesan CC-3DT++ untuk meningkatkan ketepatan pengesanan dan penjejakan sasaran 3D dengan ketara.

'Analisis Mendalam': Meneroka Algoritma Segmentasi Awan Titik LiDAR dalam Pemanduan Autonomi 'Analisis Mendalam': Meneroka Algoritma Segmentasi Awan Titik LiDAR dalam Pemanduan Autonomi Apr 23, 2023 pm 04:46 PM

Pada masa ini, terdapat dua algoritma pembahagian awan titik laser biasa: kaedah berdasarkan pemasangan satah dan kaedah berdasarkan ciri data awan titik laser. Butirannya adalah seperti berikut: Point Cloud Segmentation Ground Algorithm 01 Method based on plane fitting - GroundPlaneFitting algorithm idea: Kaedah pemprosesan yang mudah ialah membahagikan ruang kepada beberapa sub-planes sepanjang arah x (arah hadapan kereta) , dan kemudian gunakan The Ground Plane Fitting Algorithm (GPF) menghasilkan kaedah pembahagian tanah yang boleh mengendalikan cerun curam. Kaedah ini adalah untuk memuatkan satah global dalam awan titik bingkai tunggal Ia berfungsi lebih baik apabila bilangan awan titik adalah besar Apabila awan titik jarang, ia mudah menyebabkan pengesanan terlepas dan pengesanan palsu, seperti 16 baris. lidar. Pseudokod Algoritma: Proses algoritma pseudokod ialah hasil akhir pembahagian untuk awan titik tertentu P.

Penyelesaian teknologi pengesan LiDAR dalam keadaan cuaca yang teruk Penyelesaian teknologi pengesan LiDAR dalam keadaan cuaca yang teruk May 10, 2023 pm 04:07 PM

01Abstrak Kereta pandu sendiri bergantung pada pelbagai penderia untuk mengumpul maklumat tentang persekitaran sekeliling. Tingkah laku kenderaan dirancang berdasarkan kesedaran alam sekitar, jadi kebolehpercayaannya adalah penting untuk sebab keselamatan. Penderia lidar aktif mampu mencipta perwakilan 3D yang tepat bagi pemandangan, menjadikannya tambahan yang berharga kepada kesedaran alam sekitar kenderaan autonomi. Prestasi LiDAR berubah dalam keadaan cuaca buruk seperti kabus, salji atau hujan disebabkan oleh penyebaran cahaya dan penyumbatan. Batasan ini baru-baru ini telah mendorong sejumlah besar penyelidikan mengenai kaedah untuk mengurangkan kemerosotan prestasi persepsi. Kertas kerja ini mengumpul, menganalisis dan membincangkan pelbagai aspek penderiaan alam sekitar berasaskan LiDAR untuk menghadapi keadaan cuaca buruk. dan membincangkan topik seperti ketersediaan data yang sesuai, pemprosesan dan denoising awan titik mentah, algoritma persepsi yang mantap, dan gabungan sensor untuk mengurangkan

Pengenalan kepada teknologi pemprosesan isyarat radar yang dilaksanakan di Jawa Pengenalan kepada teknologi pemprosesan isyarat radar yang dilaksanakan di Jawa Jun 18, 2023 am 10:15 AM

Pengenalan: Dengan perkembangan berterusan sains dan teknologi moden, teknologi pemprosesan isyarat radar telah semakin digunakan secara meluas. Sebagai salah satu bahasa pengaturcaraan yang paling popular pada masa ini, Java digunakan secara meluas dalam pelaksanaan algoritma pemprosesan isyarat radar Artikel ini akan memperkenalkan teknologi pemprosesan isyarat radar yang dilaksanakan di Jawa. 1. Pengenalan kepada teknologi pemprosesan isyarat radar Teknologi pemprosesan isyarat radar boleh dikatakan sebagai teras dan jiwa pembangunan sistem radar, dan merupakan teknologi utama untuk merealisasikan automasi dan pendigitalan sistem radar. Teknologi pemprosesan isyarat radar termasuk pemprosesan bentuk gelombang, penapisan, mampatan nadi, dan pembentukan rasuk adaptif.

See all articles