Idea pengesanan Range View3D Baharu: RangePerception
Tajuk Ditulis Semula: Kesedaran Julat: Menjinakkan Pandangan Julat LiDAR untuk Pengesanan Objek 3D yang Cekap dan Tepat
Sila klik pautan berikut untuk melihat kertas: https://openreview.net/pdf?id=9kFQEJSyCM
Penggabungan Pengarang: Shanghai Makmal Perisikan Universiti Fudan Selepas menulis semula: Unit: Shanghai Artificial Intelligence Laboratory Fudan University
Idea tesis:
Pada masa ini, kaedah pengesanan 3D berasaskan LiDAR terutamanya menggunakan pandangan mata burung (BEV) atau asas julat (RV) Kaedah BEV bergantung pada vokselisasi dan lilitan 3D, yang mengakibatkan proses latihan dan inferens yang kurang cekap. Sebaliknya, kaedah RV menunjukkan kecekapan yang lebih tinggi kerana kekompakan dan keserasiannya dengan lilitan 2D, tetapi prestasinya masih ketinggalan daripada kaedah BEV. Untuk menghapuskan jurang prestasi sambil mengekalkan kecekapan kaedah RV, kajian ini mencadangkan rangka kerja pengesanan objek 3D berasaskan RV yang cekap dan tepat yang dipanggil RangePerception. Melalui analisis yang teliti, kajian ini mengenal pasti dua cabaran utama yang menghalang prestasi kaedah RV sedia ada: 1) Terdapat jurang domain semula jadi antara koordinat dunia 3D yang digunakan dalam output dan koordinat imej julat 2D yang digunakan dalam input, yang mengakibatkan julat daripada Ia menjadi sukar untuk mengekstrak maklumat daripada imej 2) Imej julat asal mempunyai masalah kerosakan visual, yang menjejaskan ketepatan pengesanan sasaran yang terletak di tepi imej julat. Untuk menangani cabaran ini, kertas kerja ini mencadangkan dua algoritma baru bernama Range Aware Kernel (RAK) dan Modul Pemulihan Penglihatan (VRM), yang memudahkan aliran maklumat perwakilan imej julat dan hasil pengesanan 3D koordinat dunia. Dengan bantuan RAK dan VRM, RangePerception meningkatkan purata L1/L2 AP sebanyak 3.25/4.18 berbanding kaedah RV terkini RangeDet pada Waymo Open Dataset. RangePerception ialah kaedah pengesanan 3D berasaskan RV yang pertama Berbanding dengan kaedah berasaskan BEV yang terkenal CenterPoint, purata APnya lebih tinggi sedikit, dan kelajuan inferens adalah 1.3 kali ganda daripada CenterPoint
Reka bentuk rangkaian:
. Artikel ini menunjukkan rangka kerja pengesanan 3D berasaskan RV yang cekap dan tepat yang dipanggil RangePerception. Untuk mengatasi cabaran utama di atas, dua algoritma baru bernama Range Aware Kernel (RAK) dan Modul Pemulihan Penglihatan (VRM) dicadangkan dan disepadukan ke dalam rangka kerja RangePerception, yang kedua-duanya memudahkan perwakilan imej julat dan aliran Maklumat 3D dunia koordinat hasil ujian. Dengan bantuan RAK dan VRM, RangePerception kami mencapai prestasi terkini sebagai kaedah pengesanan 3D berasaskan julat pandangan dengan menyampaikan 73.62, 80.24 dan 70.33 L1 3D AP pada WOD untuk kenderaan & pejalan kaki & penunggang basikal. Sumbangan artikel ini adalah seperti berikut.
RangePerception Framework Artikel ini memperkenalkan rangka kerja pengesanan 3D berprestasi tinggi yang dipanggil RangePerception. RangePerception ialah pengesan 3D berasaskan RV yang pertama, mencapai purata L1/L2 AP sebanyak 74.73/69.17 pada WOD, yang lebih baik daripada pengesan berasaskan RV terkini RangeDet, yang mempunyai purata L1/L2 AP 71.48/64.99, menunjukkan peningkatan 3.25/4.18. RangePerception juga menunjukkan prestasi yang lebih baik sedikit berbanding kaedah berasaskan BEV yang digunakan secara meluas CenterPoint [6], yang mencapai purata L1/L2 AP sebanyak 74.25/68.04. Terutamanya, kelajuan inferens RangePerception adalah 1.3 kali lebih pantas daripada CenterPoint, membuktikan ia lebih sesuai untuk penggunaan masa nyata pada kenderaan autonomi.
Range Aware Kernel Sebahagian daripada pengekstrak ciri RangePerception, Range Aware Kernel (RAK) ialah algoritma terobosan yang disesuaikan untuk rangkaian berasaskan RV. RAK menguraikan ruang imej julat kepada berbilang subruang dan mengatasi isu salah jajaran spatial dengan mengekstrak ciri secara bebas daripada setiap subruang. Keputusan eksperimen menunjukkan bahawa RAK meningkatkan purata L1/L2 AP sebanyak 5.75/5.99 dengan kos pengiraan yang boleh diabaikan.
Modul Pemulihan Visi Bagi menyelesaikan isu rasuah penglihatan (isu Rasuah Penglihatan), penyelidikan ini mencadangkan Modul Pemulihan Visi (VRM). VRM mengembangkan medan penerimaan rangkaian tulang belakang dengan memulihkan kawasan yang rosak sebelum ini. VRM amat membantu untuk pengesanan kenderaan, seperti yang ditunjukkan dalam bahagian percubaan.
Rajah 2: Rangka kerja RangePerception mengambil imej julat I sebagai input dan menjana ramalan yang padat. Untuk meningkatkan kesan pembelajaran perwakilan, rangka kerja menyepadukan modul VRM dan RAK dalam urutan sebelum Range Backbone. Kemudian, Pemangkas Lewahan yang direka khas digunakan untuk menghapuskan lebihan dalam ciri mendalam, dengan itu mengurangkan kos pengiraan Rangkaian Cadangan Rantau seterusnya dan lapisan pasca pemprosesan
Rajah 1: (a-d) Contoh bingkai isyarat LiDAR teratas, masing-masing diwakili oleh RV dan BEV. (e) Fenomena Penyelewengan Ruang. (f) Fenomena Rasuah Wawasan.
Rajah 3: Range Aware Kernel menguraikan ruang imej julat kepada berbilang subruang dan mengatasi isu salah jajaran spatial dengan mengekstrak ciri bebas daripada setiap subruang.
Rajah 5: Modul Pemulihan Penglihatan. Dengan mentakrifkan sudut pemulihan δ, VRM membina ruang sfera lanjutan dengan sudut azimut θ ∈ [−δ, 2π + δ]. Oleh itu, masalah rasuah visual pada kedua-dua belah imej julat I diselesaikan, dengan ketara memudahkan proses pengekstrakan ciri dari tepi I.
Keputusan percubaan:
Ringkasan: Kerangka kerja-kerja Rangka ini, jelaskan tiga dimensi
boleh menyelesaikan ketidakselarasan ruang dan kerosakan visual dengan berkesan teka-teki. Dengan memperkenalkan teknologi RAK dan VRM, RangePerception telah menunjukkan keupayaan pengesanan yang sangat baik pada WOD, sambil turut menunjukkan potensi penggunaan praktikal yang cekap dan tepatPetikan: @inproceedings{bai2023rangeperception,title={RangePerception: Taming Li{DAR} Range View for Efficient and Accurate 3D Object Detection},author={Yeqi BAI and Ben Fei and Youquan Liu and Tao MA and Yuenan Hou and Botian Shi and Yikang LI},booktitle={Thirty-seventh Conference on Neural Information Processing Systems},year={2023},url={https://openreview.net/forum?id=9kFQEJSyCM}}
Salin selepas log masuk
@inproceedings{bai2023rangeperception,title={RangePerception: Taming Li{DAR} Range View for Efficient and Accurate 3D Object Detection},author={Yeqi BAI and Ben Fei and Youquan Liu and Tao MA and Yuenan Hou and Botian Shi and Yikang LI},booktitle={Thirty-seventh Conference on Neural Information Processing Systems},year={2023},url={https://openreview.net/forum?id=9kFQEJSyCM}}
Atas ialah kandungan terperinci Idea pengesanan Range View3D Baharu: RangePerception. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

Video Face Swap
Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas











Menilai kos/prestasi sokongan komersial untuk rangka kerja Java melibatkan langkah-langkah berikut: Tentukan tahap jaminan yang diperlukan dan jaminan perjanjian tahap perkhidmatan (SLA). Pengalaman dan kepakaran pasukan sokongan penyelidikan. Pertimbangkan perkhidmatan tambahan seperti peningkatan, penyelesaian masalah dan pengoptimuman prestasi. Timbang kos sokongan perniagaan terhadap pengurangan risiko dan peningkatan kecekapan.

Keluk pembelajaran rangka kerja PHP bergantung pada kecekapan bahasa, kerumitan rangka kerja, kualiti dokumentasi dan sokongan komuniti. Keluk pembelajaran rangka kerja PHP adalah lebih tinggi jika dibandingkan dengan rangka kerja Python dan lebih rendah jika dibandingkan dengan rangka kerja Ruby. Berbanding dengan rangka kerja Java, rangka kerja PHP mempunyai keluk pembelajaran yang sederhana tetapi masa yang lebih singkat untuk bermula.

Rangka kerja PHP yang ringan meningkatkan prestasi aplikasi melalui saiz kecil dan penggunaan sumber yang rendah. Ciri-cirinya termasuk: saiz kecil, permulaan pantas, penggunaan memori yang rendah, kelajuan dan daya tindak balas yang dipertingkatkan, dan penggunaan sumber yang dikurangkan: SlimFramework mencipta API REST, hanya 500KB, responsif yang tinggi dan daya pemprosesan yang tinggi.

RedMagic Tablet 3D Explorer Edition telah dilancarkan bersama Gaming Tablet Pro. Walau bagaimanapun, sementara yang kedua lebih kepada pemain, yang pertama lebih menjurus kepada hiburan. Tablet Android baharu mempunyai apa yang syarikat panggil sebagai "3D&qu

Menulis dokumentasi yang jelas dan komprehensif adalah penting untuk rangka kerja Golang. Amalan terbaik termasuk mengikut gaya dokumentasi yang ditetapkan, seperti Panduan Gaya Pengekodan Google. Gunakan struktur organisasi yang jelas, termasuk tajuk, subtajuk dan senarai, serta sediakan navigasi. Menyediakan maklumat yang komprehensif dan tepat, termasuk panduan permulaan, rujukan API dan konsep. Gunakan contoh kod untuk menggambarkan konsep dan penggunaan. Pastikan dokumentasi dikemas kini, jejak perubahan dan dokumen ciri baharu. Sediakan sokongan dan sumber komuniti seperti isu dan forum GitHub. Buat contoh praktikal, seperti dokumentasi API.

Pilih rangka kerja Go terbaik berdasarkan senario aplikasi: pertimbangkan jenis aplikasi, ciri bahasa, keperluan prestasi dan ekosistem. Rangka kerja Common Go: Gin (aplikasi Web), Echo (Perkhidmatan Web), Fiber (daya pemprosesan tinggi), gorm (ORM), fasthttp (kelajuan). Kes praktikal: membina REST API (Fiber) dan berinteraksi dengan pangkalan data (gorm). Pilih rangka kerja: pilih fasthttp untuk prestasi utama, Gin/Echo untuk aplikasi web yang fleksibel, dan gorm untuk interaksi pangkalan data.

Pelan hala tuju pembelajaran rangka kerja Java untuk bidang yang berbeza: Pembangunan web: SpringBoot dan PlayFramework. Lapisan kegigihan: Hibernate dan JPA. Pengaturcaraan reaktif bahagian pelayan: ReactorCore dan SpringWebFlux. Pengkomputeran masa nyata: ApacheStorm dan ApacheSpark. Pengkomputeran Awan: AWS SDK untuk Java dan Google Cloud Java.

Terdapat lima salah faham dalam pembelajaran rangka kerja Go: terlalu bergantung pada rangka kerja dan fleksibiliti terhad. Jika anda tidak mengikut konvensyen rangka kerja, kod tersebut akan menjadi sukar untuk dikekalkan. Menggunakan perpustakaan lapuk boleh menyebabkan isu keselamatan dan keserasian. Penggunaan pakej yang berlebihan mengaburkan struktur kod. Mengabaikan pengendalian ralat membawa kepada tingkah laku yang tidak dijangka dan ranap sistem.
