Jadual Kandungan
Pengenalan kepada struktur utama
Hasil percubaan
Rumah Peranti teknologi AI Penyelesaian Gabungan BEV LV Baharu: Angkat-Hadiri-Percikan Melampaui BEVFusion

Penyelesaian Gabungan BEV LV Baharu: Angkat-Hadiri-Percikan Melampaui BEVFusion

Jan 13, 2024 pm 10:45 PM
Model Pemanduan autonomi

Kertas: Kaedah Lift-Attend-Splat untuk kamera pandangan mata burung dan gabungan lidar menggunakan teknologi Transformer

Sila klik pautan untuk melihat fail: https://arxiv.org/pdf/2312.14919.pdf

Untuk keselamatan- aplikasi kritikal seperti pemanduan autonomi Adalah penting untuk menggabungkan modaliti sensor pelengkap. Kaedah gabungan kamera-lidar pemanduan autonomi terkini menggunakan anggaran kedalaman monokular untuk meningkatkan persepsi, tetapi ini adalah tugas yang sukar berbanding dengan menggunakan maklumat kedalaman secara langsung daripada lidar. Kajian kami mendapati bahawa pendekatan ini tidak mengeksploitasi sepenuhnya maklumat kedalaman dan menunjukkan bahawa penambahbaikan anggaran kedalaman secara naif tidak meningkatkan prestasi pengesanan objek. Yang menghairankan, mengalih keluar anggaran kedalaman sepenuhnya tidak merendahkan prestasi pengesanan objek

Ini menunjukkan bahawa pergantungan pada kedalaman monokular mungkin merupakan kesesakan seni bina yang tidak perlu semasa gabungan kamera-lidar. Kajian ini mencadangkan kaedah gabungan baharu yang memintas sepenuhnya anggaran kedalaman monokular dan sebaliknya menggunakan mekanisme perhatian mudah untuk memilih dan menggabungkan ciri kamera dan lidar dalam grid BEV. Keputusan menunjukkan bahawa model yang dicadangkan mampu melaraskan penggunaan ciri kamera berdasarkan ketersediaan ciri lidar dan mempunyai prestasi pengesanan 3D yang lebih baik pada dataset nuScenes daripada model garis dasar berdasarkan anggaran kedalaman monokular

Pengenalan kepada kajian ini Kamera baharu -kaedah gabungan lidar yang dipanggil "Lift Attented Splat" telah dibangunkan. Kaedah ini mengelakkan anggaran kedalaman monokular dan sebaliknya menggunakan pengubah mudah untuk memilih dan menggabungkan ciri kamera dan lidar dalam BEV. Eksperimen membuktikan bahawa berbanding dengan kaedah berdasarkan anggaran kedalaman monokular, kaedah penyelidikan ini boleh menggunakan kamera dengan lebih baik dan meningkatkan prestasi pengesanan objek. Sumbangan kajian ini adalah seperti berikut:

  1. Kaedah gabungan kamera-lidar berdasarkan paradigma Lift Splat tidak mengeksploitasi kedalaman seperti yang diharapkan. Khususnya, kami menunjukkan bahawa mereka berprestasi sama baik atau lebih baik jika ramalan kedalaman monokular dialih keluar sepenuhnya.
  2. Kertas kerja ini memperkenalkan kaedah gabungan kamera-lidar baharu yang menggunakan mekanisme perhatian mudah untuk menggabungkan ciri kamera dan lidar dalam BEV tulen. Kertas kerja menunjukkan bahawa ia boleh menggunakan kamera dengan lebih baik dan meningkatkan prestasi pengesanan 3D berbanding model berdasarkan paradigma Lift Splat.

Pengenalan kepada struktur utama

Ketepatan ramalan kedalaman biasanya rendah. Analisis kualitatif dan kuantitatif boleh dilakukan dengan membandingkan kualiti kedalaman yang diramalkan oleh BEVFusion dengan peta kedalaman lidar menggunakan ralat relatif mutlak (Abs.Rel.) dan ralat purata kuasa dua (RMSE). Seperti yang ditunjukkan dalam Rajah 1, ramalan kedalaman tidak menggambarkan dengan tepat struktur tempat kejadian dan berbeza dengan ketara daripada peta kedalaman lidar, menunjukkan bahawa kedalaman monokular tidak digunakan sepenuhnya seperti yang diharapkan. Kajian itu juga mendapati bahawa meningkatkan ramalan kedalaman tidak meningkatkan prestasi pengesanan objek! Mengalih keluar ramalan kedalaman sepenuhnya tidak memberi kesan kepada prestasi pengesanan objek

超越BEVFusion!Lift-Attend-Splat:最新BEV LV融合方案

Kami mencadangkan kaedah gabungan kamera-lidar yang memintas sepenuhnya anggaran kedalaman monokular dan sebaliknya menggunakan pengubah ringkas untuk bergabung dalam ciri Kamera dan lidar pandangan mata burung. Walau bagaimanapun, disebabkan oleh bilangan ciri kamera dan lidar yang banyak dan sifat perhatian kuadratik, seni bina pengubah sukar untuk digunakan dengan mudah pada masalah gabungan kamera-lidar. Apabila menayangkan ciri kamera dalam BEV, geometri masalah boleh digunakan untuk mengehadkan skop perhatian dengan ketara, kerana ciri kamera sepatutnya hanya menyumbang kepada kedudukan di sepanjang sinaran yang sepadan. Kami menggunakan idea ini pada kes gabungan kamera-lidar dan memperkenalkan kaedah gabungan mudah yang menggunakan perhatian silang antara lajur dalam satah kamera dan sinar kutub dalam grid BEV lidar! Daripada meramalkan kedalaman monokular, perhatian silang mempelajari ciri kamera yang paling menonjol dalam konteks yang disediakan oleh ciri lidar di sepanjang sinarnya

Model kami mempunyai seni bina keseluruhan yang serupa dengan kaedah berdasarkan paradigma Lift Splat, Selain menayangkan ciri kamera dalam BEV. Seperti yang ditunjukkan dalam rajah di bawah, ia terdiri daripada kamera dan tulang belakang lidar, modul yang menjana secara bebas setiap ciri modal, modul unjuran dan gabungan yang membenamkan ciri kamera ke dalam BEV dan menggabungkannya dengan lidar serta kepala pengesanan. Apabila mempertimbangkan pengesanan sasaran, output akhir model ialah atribut sasaran dalam adegan, termasuk kedudukan, dimensi, arah, kelajuan dan maklumat klasifikasi, yang diwakili dalam bentuk kotak sempadan 3D

Lift Attented Splat camera lidar fusion seni bina ditunjukkan di bawah. (Kiri) Seni bina keseluruhan: Ciri daripada kamera dan tulang belakang lidar disatukan sebelum dihantar ke kepala pengesan. (inset) Geometri unjuran 3D kami: Langkah "Angkat" membenamkan ciri BEV lidar ke dalam ufuk yang diunjurkan dengan menggunakan pensampelan dwilinear untuk mengangkat ciri lidar di sepanjang arah z. Langkah "percikan" sepadan dengan transformasi songsang, kerana ia menggunakan pensampelan dwilinear untuk menayangkan ciri dari ufuk yang diunjurkan kembali ke grid BEV, sekali lagi di sepanjang arah z! Di sebelah kanan ialah butiran modul projek.

超越BEVFusion!Lift-Attend-Splat:最新BEV LV融合方案

Hasil percubaan

超越BEVFusion!Lift-Attend-Splat:最新BEV LV融合方案

超越BEVFusion!Lift-Attend-Splat:最新BEV LV融合方案

超越BEVFusion!Lift-Attend-Splat:最新BEV LV融合方案

超越BEVFusion!Lift-Attend-Splat:最新BEV LV融合方案

Pautan asal: https://mp.weixin.qq.com/s/U63xCRSvrp

Atas ialah kandungan terperinci Penyelesaian Gabungan BEV LV Baharu: Angkat-Hadiri-Percikan Melampaui BEVFusion. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)
1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Tetapan grafik terbaik
1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌
Akan R.E.P.O. Ada Crossplay?
1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Bagaimana untuk menyelesaikan masalah ekor panjang dalam senario pemanduan autonomi? Bagaimana untuk menyelesaikan masalah ekor panjang dalam senario pemanduan autonomi? Jun 02, 2024 pm 02:44 PM

Semalam semasa temu bual, saya telah ditanya sama ada saya telah membuat sebarang soalan berkaitan ekor panjang, jadi saya fikir saya akan memberikan ringkasan ringkas. Masalah ekor panjang pemanduan autonomi merujuk kepada kes tepi dalam kenderaan autonomi, iaitu, kemungkinan senario dengan kebarangkalian yang rendah untuk berlaku. Masalah ekor panjang yang dirasakan adalah salah satu sebab utama yang kini mengehadkan domain reka bentuk pengendalian kenderaan autonomi pintar satu kenderaan. Seni bina asas dan kebanyakan isu teknikal pemanduan autonomi telah diselesaikan, dan baki 5% masalah ekor panjang secara beransur-ansur menjadi kunci untuk menyekat pembangunan pemanduan autonomi. Masalah ini termasuk pelbagai senario yang berpecah-belah, situasi yang melampau dan tingkah laku manusia yang tidak dapat diramalkan. "Ekor panjang" senario tepi dalam pemanduan autonomi merujuk kepada kes tepi dalam kenderaan autonomi (AVs) kes Edge adalah senario yang mungkin dengan kebarangkalian yang rendah untuk berlaku. kejadian yang jarang berlaku ini

Model MoE sumber terbuka paling berkuasa di dunia ada di sini, dengan keupayaan bahasa Cina setanding dengan GPT-4, dan harganya hanya hampir satu peratus daripada GPT-4-Turbo Model MoE sumber terbuka paling berkuasa di dunia ada di sini, dengan keupayaan bahasa Cina setanding dengan GPT-4, dan harganya hanya hampir satu peratus daripada GPT-4-Turbo May 07, 2024 pm 04:13 PM

Bayangkan model kecerdasan buatan yang bukan sahaja mempunyai keupayaan untuk mengatasi pengkomputeran tradisional, tetapi juga mencapai prestasi yang lebih cekap pada kos yang lebih rendah. Ini bukan fiksyen sains, DeepSeek-V2[1], model MoE sumber terbuka paling berkuasa di dunia ada di sini. DeepSeek-V2 ialah gabungan model bahasa pakar (MoE) yang berkuasa dengan ciri-ciri latihan ekonomi dan inferens yang cekap. Ia terdiri daripada 236B parameter, 21B daripadanya digunakan untuk mengaktifkan setiap penanda. Berbanding dengan DeepSeek67B, DeepSeek-V2 mempunyai prestasi yang lebih kukuh, sambil menjimatkan 42.5% kos latihan, mengurangkan cache KV sebanyak 93.3% dan meningkatkan daya pemprosesan penjanaan maksimum kepada 5.76 kali. DeepSeek ialah sebuah syarikat yang meneroka kecerdasan buatan am

Apr 09, 2024 am 11:52 AM

AI memang mengubah matematik. Baru-baru ini, Tao Zhexuan, yang telah mengambil perhatian terhadap isu ini, telah memajukan keluaran terbaru "Buletin Persatuan Matematik Amerika" (Buletin Persatuan Matematik Amerika). Memfokuskan pada topik "Adakah mesin akan mengubah matematik?", ramai ahli matematik menyatakan pendapat mereka Seluruh proses itu penuh dengan percikan api, tegar dan menarik. Penulis mempunyai barisan yang kuat, termasuk pemenang Fields Medal Akshay Venkatesh, ahli matematik China Zheng Lejun, saintis komputer NYU Ernest Davis dan ramai lagi sarjana terkenal dalam industri. Dunia AI telah berubah secara mendadak Anda tahu, banyak artikel ini telah dihantar setahun yang lalu.

Google gembira: prestasi JAX mengatasi Pytorch dan TensorFlow! Ia mungkin menjadi pilihan terpantas untuk latihan inferens GPU Google gembira: prestasi JAX mengatasi Pytorch dan TensorFlow! Ia mungkin menjadi pilihan terpantas untuk latihan inferens GPU Apr 01, 2024 pm 07:46 PM

Prestasi JAX, yang dipromosikan oleh Google, telah mengatasi Pytorch dan TensorFlow dalam ujian penanda aras baru-baru ini, menduduki tempat pertama dalam 7 penunjuk. Dan ujian tidak dilakukan pada TPU dengan prestasi JAX terbaik. Walaupun dalam kalangan pembangun, Pytorch masih lebih popular daripada Tensorflow. Tetapi pada masa hadapan, mungkin lebih banyak model besar akan dilatih dan dijalankan berdasarkan platform JAX. Model Baru-baru ini, pasukan Keras menanda aras tiga hujung belakang (TensorFlow, JAX, PyTorch) dengan pelaksanaan PyTorch asli dan Keras2 dengan TensorFlow. Pertama, mereka memilih satu set arus perdana

Hello, Atlas elektrik! Robot Boston Dynamics hidup semula, gerakan pelik 180 darjah menakutkan Musk Hello, Atlas elektrik! Robot Boston Dynamics hidup semula, gerakan pelik 180 darjah menakutkan Musk Apr 18, 2024 pm 07:58 PM

Boston Dynamics Atlas secara rasmi memasuki era robot elektrik! Semalam, Atlas hidraulik hanya "menangis" menarik diri daripada peringkat sejarah Hari ini, Boston Dynamics mengumumkan bahawa Atlas elektrik sedang berfungsi. Nampaknya dalam bidang robot humanoid komersial, Boston Dynamics berazam untuk bersaing dengan Tesla. Selepas video baharu itu dikeluarkan, ia telah pun ditonton oleh lebih sejuta orang dalam masa sepuluh jam sahaja. Orang lama pergi dan peranan baru muncul. Ini adalah keperluan sejarah. Tidak dinafikan bahawa tahun ini adalah tahun letupan robot humanoid. Netizen mengulas: Kemajuan robot telah menjadikan majlis pembukaan tahun ini kelihatan seperti manusia, dan tahap kebebasan adalah jauh lebih besar daripada manusia Tetapi adakah ini benar-benar bukan filem seram? Pada permulaan video, Atlas berbaring dengan tenang di atas tanah, seolah-olah terlentang. Apa yang berikut adalah rahang-jatuh

KAN, yang menggantikan MLP, telah diperluaskan kepada konvolusi oleh projek sumber terbuka KAN, yang menggantikan MLP, telah diperluaskan kepada konvolusi oleh projek sumber terbuka Jun 01, 2024 pm 10:03 PM

Awal bulan ini, penyelidik dari MIT dan institusi lain mencadangkan alternatif yang sangat menjanjikan kepada MLP - KAN. KAN mengatasi MLP dari segi ketepatan dan kebolehtafsiran. Dan ia boleh mengatasi prestasi MLP berjalan dengan bilangan parameter yang lebih besar dengan bilangan parameter yang sangat kecil. Sebagai contoh, penulis menyatakan bahawa mereka menggunakan KAN untuk menghasilkan semula keputusan DeepMind dengan rangkaian yang lebih kecil dan tahap automasi yang lebih tinggi. Khususnya, MLP DeepMind mempunyai kira-kira 300,000 parameter, manakala KAN hanya mempunyai kira-kira 200 parameter. KAN mempunyai asas matematik yang kukuh seperti MLP berdasarkan teorem penghampiran universal, manakala KAN berdasarkan teorem perwakilan Kolmogorov-Arnold. Seperti yang ditunjukkan dalam rajah di bawah, KAN telah

Mari kita bincangkan tentang sistem pemanduan autonomi hujung ke hujung dan generasi seterusnya, serta beberapa salah faham tentang pemanduan autonomi hujung ke hujung? Mari kita bincangkan tentang sistem pemanduan autonomi hujung ke hujung dan generasi seterusnya, serta beberapa salah faham tentang pemanduan autonomi hujung ke hujung? Apr 15, 2024 pm 04:13 PM

Pada bulan lalu, atas sebab-sebab yang diketahui umum, saya telah mengadakan pertukaran yang sangat intensif dengan pelbagai guru dan rakan sekelas dalam industri. Topik yang tidak dapat dielakkan dalam pertukaran secara semula jadi adalah hujung ke hujung dan Tesla FSDV12 yang popular. Saya ingin mengambil kesempatan ini untuk menyelesaikan beberapa buah fikiran dan pendapat saya pada masa ini untuk rujukan dan perbincangan anda. Bagaimana untuk mentakrifkan sistem pemanduan autonomi hujung ke hujung, dan apakah masalah yang sepatutnya dijangka diselesaikan hujung ke hujung? Menurut definisi yang paling tradisional, sistem hujung ke hujung merujuk kepada sistem yang memasukkan maklumat mentah daripada penderia dan secara langsung mengeluarkan pembolehubah yang membimbangkan tugas. Sebagai contoh, dalam pengecaman imej, CNN boleh dipanggil hujung-ke-hujung berbanding kaedah pengekstrak ciri + pengelas tradisional. Dalam tugas pemanduan autonomi, masukkan data daripada pelbagai penderia (kamera/LiDAR

SOTA terbaharu nuScenes |. SparseAD: Pertanyaan jarang membantu pemanduan autonomi hujung ke hujung yang cekap! SOTA terbaharu nuScenes |. SparseAD: Pertanyaan jarang membantu pemanduan autonomi hujung ke hujung yang cekap! Apr 17, 2024 pm 06:22 PM

Ditulis di hadapan & titik permulaan Paradigma hujung ke hujung menggunakan rangka kerja bersatu untuk mencapai pelbagai tugas dalam sistem pemanduan autonomi. Walaupun kesederhanaan dan kejelasan paradigma ini, prestasi kaedah pemanduan autonomi hujung ke hujung pada subtugas masih jauh ketinggalan berbanding kaedah tugasan tunggal. Pada masa yang sama, ciri pandangan mata burung (BEV) padat yang digunakan secara meluas dalam kaedah hujung ke hujung sebelum ini menyukarkan untuk membuat skala kepada lebih banyak modaliti atau tugasan. Paradigma pemanduan autonomi hujung ke hujung (SparseAD) tertumpu carian jarang dicadangkan di sini, di mana carian jarang mewakili sepenuhnya keseluruhan senario pemanduan, termasuk ruang, masa dan tugas, tanpa sebarang perwakilan BEV yang padat. Khususnya, seni bina jarang bersatu direka bentuk untuk kesedaran tugas termasuk pengesanan, penjejakan dan pemetaan dalam talian. Di samping itu, berat

See all articles