SOTA terbaharu nuScenes |. SparseAD: Pertanyaan jarang membantu pemanduan autonomi hujung ke hujung yang cekap!-AI-php.cn

Jadual Kandungan

Ditulis di hadapan & titik permulaan

Latar belakang padang

Struktur rangkaian SparseAD

Persepsi Jarang

Motion Planner

Hasil eksperimen

Hasil Pelbagai Tugas

Rumah

Peranti teknologi

SOTA terbaharu nuScenes |. SparseAD: Pertanyaan jarang membantu pemanduan autonomi hujung ke hujung yang cekap!

PHPz

Apr 17, 2024 pm 06:22 PM

hujung ke hujung Pemanduan autonomi Penggunaan memori

Ditulis di hadapan & titik permulaan

Paradigma hujung ke hujung menggunakan rangka kerja bersatu untuk mencapai pelbagai tugas dalam sistem pemanduan autonomi. Walaupun kesederhanaan dan kejelasan paradigma ini, prestasi kaedah pemanduan autonomi hujung ke hujung pada subtugas masih jauh ketinggalan berbanding kaedah tugasan tunggal. Pada masa yang sama, ciri pandangan mata burung (BEV) padat yang digunakan secara meluas dalam kaedah hujung ke hujung sebelum ini menyukarkan untuk membuat skala kepada lebih banyak modaliti atau tugasan. Paradigma pemanduan autonomi hujung ke hujung (SparseAD) tertumpu carian jarang dicadangkan di sini, di mana carian jarang mewakili sepenuhnya keseluruhan senario pemanduan, termasuk ruang, masa dan tugas, tanpa sebarang perwakilan BEV yang padat. Khususnya, seni bina jarang bersatu direka bentuk untuk kesedaran tugas termasuk pengesanan, penjejakan dan pemetaan dalam talian. Tambahan pula, ramalan dan perancangan gerakan dikaji semula, manakala rangka kerja perancangan gerakan yang lebih munasabah direka bentuk. Pada set data nuScenes yang mencabar, SparseAD mencapai prestasi tugas penuh tercanggih dalam pendekatan hujung ke hujung dan mengurangkan jurang prestasi antara paradigma hujung ke hujung dan pendekatan tugas tunggal.

Latar belakang padang

Sistem pemanduan autonomi perlu membuat keputusan yang betul dalam senario pemanduan yang kompleks untuk memastikan keselamatan dan keselesaan pemanduan. Biasanya, sistem pemanduan autonomi mengintegrasikan pelbagai tugas seperti pengesanan, penjejakan, pemetaan dalam talian, ramalan gerakan dan perancangan. Seperti yang ditunjukkan dalam Rajah 1a, paradigma modular tradisional membahagikan sistem yang kompleks kepada beberapa tugas individu, setiap satunya dioptimumkan secara bebas. Dalam paradigma ini, pemprosesan pasca manual diperlukan antara modul tugas tunggal bebas, yang menjadikan keseluruhan proses lebih rumit. Sebaliknya, disebabkan oleh kehilangan pemampatan maklumat tempat kejadian antara tugas yang disusun, ralat dalam keseluruhan sistem terkumpul, yang mungkin membawa kepada potensi isu keselamatan.

nuScenes最新SOTA | SparseAD：稀疏查询助力高效端到端自动驾驶！

Berkenaan isu di atas, sistem pemanduan autonomi hujung ke hujung mengambil data perceptron mentah sebagai input dan mengembalikan hasil perancangan dengan cara yang lebih ringkas. Kerja awal mencadangkan melangkau tugas perantaraan dan meramalkan hasil perancangan secara langsung daripada data perceptron mentah. Walaupun pendekatan ini lebih mudah, ia tidak memuaskan dari segi pengoptimuman model, kebolehtafsiran dan prestasi perancangan. Satu lagi paradigma pelbagai segi dengan kebolehtafsiran yang lebih baik adalah untuk menyepadukan berbilang bahagian pemanduan autonomi ke dalam model hujung-ke-hujung modular, yang memperkenalkan penyeliaan berbilang dimensi untuk meningkatkan pemahaman senario pemanduan yang kompleks, Dan membawa keupayaan untuk berbilang tugas.

Seperti yang ditunjukkan dalam Rajah 1b, dalam kebanyakan kaedah hujung ke hujung modular termaju, keseluruhan senario pemanduan dicirikan oleh koleksi padat ciri pandangan mata burung (BEV) yang merangkumi maklumat berbilang sensor dan temporal serta berfungsi sebagai Input timbunan penuh yang mendorong tugas termasuk persepsi, ramalan dan perancangan. Walaupun ciri BEV teragregat padat memainkan peranan penting dalam mencapai pelbagai mod dan pelbagai tugas merentas ruang dan masa, kaedah hujung ke hujung sebelumnya menggunakan perwakilan BEV diringkaskan sebagai paradigma Dense BEV-Centric. Walaupun kesederhanaan dan kebolehtafsiran kaedah ini, prestasi mereka pada setiap subtugas pemanduan autonomi masih jauh ketinggalan berbanding kaedah tugasan tunggal yang sepadan. Di samping itu, di bawah paradigma Dense BEV-Centric, gabungan temporal jangka panjang dan gabungan pelbagai mod dicapai terutamanya melalui pelbagai peta ciri BEV, yang membawa kepada peningkatan ketara dalam kos pengkomputeran dan penggunaan memori, dan membawa beban yang lebih besar kepada sebenar. penempatan.

Paradigma pemanduan autonomi hujung ke hujung (SparseAD) berpusat carian jarang novel dicadangkan di sini. Dalam paradigma ini, elemen spatial dan temporal dalam keseluruhan adegan pemanduan diwakili oleh jadual carian yang jarang, meninggalkan ciri Pandangan Mata Burung (BEV) ensembel padat tradisional, seperti yang ditunjukkan dalam Rajah 1c. Perwakilan yang jarang ini membolehkan model hujung ke hujung untuk menggunakan maklumat sejarah yang lebih lama dan skala kepada lebih banyak mod dan tugas sambil mengurangkan kos pengiraan dan jejak memori dengan ketara.

Mereka bentuk semula seni bina modular hujung ke hujung dan memudahkannya menjadi struktur ringkas yang terdiri daripada persepsi jarang dan perancang gerakan. Dalam modul persepsi jarang, penyahkod temporal universal digunakan untuk menyatukan tugas persepsi termasuk pengesanan, penjejakan dan pemetaan dalam talian. Dalam proses ini, ciri berbilang penderia dan rekod sejarah dianggap sebagai token, manakala pertanyaan objek dan pertanyaan peta masing-masing mewakili halangan dan elemen jalan dalam adegan pemanduan. Dalam perancang gerakan, pertanyaan persepsi jarang digunakan sebagai perwakilan persekitaran, dan ramalan gerakan berbilang modal dilakukan pada kenderaan dan ejen sekeliling secara serentak untuk mendapatkan berbilang penyelesaian perancangan awal untuk kenderaan sendiri. Selepas itu, kekangan pemanduan pelbagai dimensi dipertimbangkan sepenuhnya untuk menjana hasil perancangan akhir.

Sumbangan utama:

Cadangkan paradigma pemanduan autonomi hujung-ke-hujung berpusatkan pertanyaan jarang (SparseAD), yang meninggalkan kaedah perwakilan pandangan mata burung (BEV) padat tradisional dan oleh itu mempunyai potensi besar untuk menskalakan lebih banyak modaliti dan tugasan dengan cekap.
Permudahkan seni bina hujung ke hujung modular kepada dua bahagian: penderiaan jarang dan perancangan gerakan. Dalam bahagian persepsi yang jarang, tugas-tugas persepsi seperti pengesanan, pengesanan, dan pemetaan dalam talian disatukan dengan cara yang sangat jarang manakala dalam bahagian perancangan gerakan, ramalan dan perancangan gerakan dijalankan di bawah rangka kerja yang lebih munasabah.
Pada set data nuScenes yang mencabar, SparseAD mencapai prestasi tercanggih antara kaedah hujung ke hujung dan mengecilkan jurang prestasi antara paradigma hujung ke hujung dan kaedah tugas tunggal dengan ketara. Ini menunjukkan sepenuhnya potensi besar paradigma hujung ke hujung yang jarang dicadangkan. SparseAD bukan sahaja meningkatkan prestasi dan kecekapan sistem pemanduan autonomi, tetapi juga menyediakan hala tuju dan kemungkinan baharu untuk penyelidikan dan aplikasi masa hadapan.

Struktur rangkaian SparseAD

Seperti yang ditunjukkan dalam Rajah 1c, dalam paradigma berpusatkan pertanyaan jarang yang dicadangkan, pertanyaan jarang berbeza sepenuhnya mewakili keseluruhan adegan pemanduan dan bukan sahaja bertanggungjawab untuk pemindahan maklumat dan interaksi antara modul, Kecerunan ke belakang adalah juga disebarkan merentasi pelbagai tugas dengan cara hujung ke hujung untuk pengoptimuman. Berbeza daripada kaedah berpusat pandangan mata burung (BEV) set padat sebelumnya, tiada unjuran pandangan dan ciri BEV padat digunakan dalam SparseAD, dengan itu mengelakkan beban pengiraan dan ingatan yang berat Seni bina terperinci SparseAD ditunjukkan dalam Rajah 2.

nuScenes最新SOTA | SparseAD：稀疏查询助力高效端到端自动驾驶！

Daripada rajah seni bina, SparseAD terutamanya terdiri daripada tiga bahagian, termasuk pengekod sensor, persepsi jarang dan perancang gerakan. Khususnya, pengekod sensor mengambil sebagai input imej kamera berbilang pandangan, mata radar atau lidar dan mengekodnya ke dalam ciri dimensi tinggi. Ciri-ciri ini kemudiannya dimasukkan ke dalam modul penderiaan jarang sebagai token penderia bersama dengan pembenaman kedudukan (PE). Dalam modul penderiaan jarang, data mentah daripada penderia akan diagregatkan ke dalam pelbagai pertanyaan penderiaan jarang, seperti pertanyaan pengesanan, pertanyaan penjejakan dan pertanyaan peta, yang masing-masing mewakili elemen berbeza dalam adegan pemanduan dan akan disebarkan lagi ke hiliran tugasan. Dalam perancang gerakan, pertanyaan persepsi dianggap sebagai gambaran jarang adegan pemanduan dan dieksploitasi sepenuhnya untuk semua ejen di sekeliling dan kenderaan sendiri. Pada masa yang sama, beberapa kekangan pemanduan dianggap untuk menjana pelan akhir yang selamat dan mematuhi dinamik.

Selain itu, perpustakaan memori berbilang tugas hujung ke hujung diperkenalkan dalam seni bina untuk menyimpan maklumat pemasaan keseluruhan adegan pemanduan secara seragam, yang membolehkan sistem mendapat manfaat daripada pengagregatan maklumat sejarah jangka panjang untuk dilengkapkan tugas memandu tumpukan penuh.

Seperti yang ditunjukkan dalam Rajah 3, modul persepsi jarang SparseAD menyatukan pelbagai tugas persepsi dengan cara yang jarang, termasuk pengesanan, penjejakan dan pemetaan dalam talian. Secara khusus, terdapat dua penyahkod temporal yang serupa secara struktur yang mengeksploitasi maklumat sejarah jangka panjang daripada bank memori. Salah satu penyahkod digunakan untuk pengesanan halangan dan satu lagi digunakan untuk pemetaan dalam talian.

nuScenes最新SOTA | SparseAD：稀疏查询助力高效端到端自动驾驶！

Selepas pengagregatan maklumat melalui pertanyaan persepsi yang sepadan dengan tugasan yang berbeza, kepala pengesanan dan pengesanan serta bahagian peta digunakan untuk menyahkod dan mengeluarkan halangan dan elemen peta masing-masing. Selepas itu, proses kemas kini dilakukan, yang menapis dan menyimpan pertanyaan penderiaan berkeyakinan tinggi bagi bingkai semasa dan mengemas kini bank memori dengan sewajarnya, yang akan memberi manfaat kepada proses penderiaan bingkai seterusnya.

Dengan cara ini, modul persepsi jarang SparseAD mencapai persepsi yang cekap dan tepat tentang adegan pemanduan, menyediakan asas maklumat penting untuk perancangan gerakan seterusnya. Pada masa yang sama, dengan menggunakan maklumat sejarah dalam bank memori, modul ini boleh meningkatkan lagi ketepatan dan kestabilan persepsi dan memastikan operasi sistem pemanduan autonomi yang boleh dipercayai.

Persepsi Jarang

Dari segi persepsi halangan, pengesanan dan pengesanan bersama diterima pakai dalam penyahkod bersatu tanpa sebarang pemprosesan pasca manual tambahan. Terdapat ketidakseimbangan yang ketara antara pertanyaan pengesanan dan penjejakan, yang boleh menyebabkan kemerosotan ketara dalam prestasi pengesanan. Bagi mengurangkan masalah di atas, prestasi pengesanan halangan telah dipertingkatkan dari pelbagai sudut. Pertama, mekanisme memori dua peringkat diperkenalkan untuk menyebarkan maklumat temporal merentasi bingkai. Antaranya, ingatan peringkat adegan mengekalkan maklumat pertanyaan tanpa korelasi bingkai silang, manakala ingatan peringkat contoh mengekalkan korespondensi antara bingkai bersebelahan bagi halangan penjejakan. Kedua, mengambil kira asal usul dan tugas yang berbeza bagi kedua-duanya, strategi kemas kini yang berbeza digunakan untuk ingatan peringkat adegan dan peringkat contoh. Khususnya, memori peringkat pemandangan dikemas kini melalui MLN, manakala memori peringkat contoh dikemas kini dengan ramalan masa depan untuk setiap halangan. Selain itu, semasa latihan, strategi peningkatan digunakan untuk menjejak pertanyaan untuk mengimbangi penyeliaan antara dua tahap ingatan, dengan itu meningkatkan prestasi pengesanan dan penjejakan. Selepas itu, dengan mengesan dan menjejak kepala, kotak sempadan 3D dengan atribut dan ID unik boleh dinyahkod daripada pertanyaan pengesanan atau penjejakan dan kemudian digunakan lagi dalam tugas hiliran.

Pembinaan peta dalam talian adalah tugas yang kompleks dan penting. Mengikut pengetahuan semasa, kaedah pembinaan peta dalam talian sedia ada kebanyakannya bergantung pada ciri pandangan mata burung (BEV) yang padat untuk mewakili persekitaran pemanduan. Pendekatan ini mempunyai kesukaran untuk memperluaskan julat penderiaan atau memanfaatkan maklumat sejarah kerana ia memerlukan sejumlah besar memori dan sumber pengkomputeran. Kami amat percaya bahawa semua elemen peta boleh diwakili dengan cara yang jarang, oleh itu, kami cuba menyelesaikan pembinaan peta dalam talian di bawah paradigma jarang. Khususnya, struktur penyahkod temporal yang sama seperti dalam tugas persepsi halangan diguna pakai. Pada mulanya, pertanyaan peta dengan kategori terdahulu dimulakan untuk diedarkan secara seragam pada pesawat pemanduan. Dalam penyahkod temporal, pertanyaan peta berinteraksi dengan penanda penderia dan penanda ingatan sejarah. Penanda ingatan sejarah ini sebenarnya terdiri daripada pertanyaan peta yang sangat yakin daripada bingkai sebelumnya. Pertanyaan peta yang dikemas kini kemudiannya membawa maklumat yang sah tentang elemen peta bingkai semasa dan boleh ditolak ke bank memori untuk digunakan dalam bingkai masa hadapan atau tugasan hiliran.

Jelas sekali, proses pembinaan peta dalam talian adalah lebih kurang sama dengan persepsi halangan. Iaitu, tugas pengesanan termasuk pengesanan, penjejakan dan pembinaan peta dalam talian disatukan ke dalam pendekatan jarang biasa yang lebih cekap apabila menskala ke julat yang lebih besar (cth., 100m × 100m) atau gabungan jangka panjang, dan tidak memerlukan sebarang operasi yang kompleks (seperti perhatian boleh ubah bentuk atau perhatian berbilang titik). Untuk pengetahuan terbaik kami, ini adalah yang pertama melaksanakan pembinaan peta dalam talian dalam seni bina persepsi bersatu dengan cara yang jarang. Selepas itu, Kepala peta Bezier sekeping digunakan untuk mengembalikan titik kawalan Bezier sekeping bagi setiap elemen peta jarang, dan titik kawalan ini boleh diubah dengan mudah untuk memenuhi keperluan tugas hiliran.

Motion Planner

Kami meneliti semula masalah ramalan dan perancangan gerakan dalam sistem pemanduan autonomi dan mendapati bahawa banyak kaedah sebelum ini mengabaikan dinamik kenderaan ego apabila meramalkan pergerakan kenderaan sekeliling. Walaupun ini mungkin tidak nyata dalam kebanyakan situasi, ia boleh menjadi potensi risiko dalam senario seperti persimpangan yang terdapat interaksi rapat antara kenderaan berdekatan dan kenderaan hos. Diilhamkan oleh ini, rangka kerja perancangan gerakan yang lebih munasabah telah direka. Dalam rangka kerja ini, peramal gerakan meramalkan pergerakan kenderaan sekeliling dan kenderaan sendiri secara serentak. Selepas itu, keputusan ramalan kenderaan sendiri digunakan sebagai motion priors dalam pengoptimuman perancangan seterusnya. Semasa proses perancangan, kami mempertimbangkan aspek kekangan yang berbeza untuk menghasilkan hasil perancangan akhir yang memenuhi keperluan keselamatan dan dinamik.

nuScenes最新SOTA | SparseAD：稀疏查询助力高效端到端自动驾驶！

Seperti yang ditunjukkan dalam Rajah 4, perancang gerakan dalam SparseAD merawat pertanyaan persepsi (termasuk pertanyaan trajektori dan pertanyaan peta) sebagai perwakilan jarang adegan pemanduan semasa. Pertanyaan gerakan multimodal digunakan sebagai medium untuk membolehkan pemahaman senario pemanduan, persepsi interaksi antara semua kenderaan (termasuk kenderaan sendiri), dan permainan kemungkinan masa depan yang berbeza. Pertanyaan gerakan multimodal kenderaan itu kemudiannya dimasukkan ke dalam pengoptimum perancangan, yang mengambil kira kekangan pemanduan termasuk arahan peringkat tinggi, keselamatan dan dinamik.

Peramal Pergerakan. Mengikuti kaedah sebelumnya, persepsi dan penyepaduan antara pertanyaan gerakan dan perwakilan pemandangan pemanduan semasa (termasuk pertanyaan trajektori dan pertanyaan peta) dicapai melalui lapisan pengubah standard. Selain itu, ejen kenderaan sendiri dan interaksi rentas mod digunakan untuk memodelkan bersama interaksi antara ejen di sekeliling dan kenderaan sendiri dalam adegan spatio-temporal masa hadapan. Melalui sinergi modul dalam dan antara struktur susun berbilang lapisan, pertanyaan gerakan dapat mengagregatkan maklumat semantik yang kaya daripada persekitaran statik dan dinamik.

Selain perkara di atas, dua strategi juga diperkenalkan untuk meningkatkan lagi prestasi peramal gerakan. Pertama, ramalan yang mudah dan mudah dibuat menggunakan ingatan temporal peringkat contoh bagi pertanyaan trajektori sebagai sebahagian daripada permulaan pertanyaan gerakan ejen di sekeliling. Dengan cara ini, peramal gerakan dapat mendapat manfaat daripada pengetahuan terdahulu yang diperoleh daripada tugas huluan. Kedua, terima kasih kepada perpustakaan memori hujung ke hujung, maklumat berguna boleh diasimilasikan daripada pertanyaan gerakan sejarah yang disimpan secara penstriman melalui agregator memori ejen pada kos yang hampir boleh diabaikan.

Perlu diambil perhatian bahawa pertanyaan gerakan pelbagai mod kereta ini dikemas kini pada masa yang sama. Dengan cara ini, usul sebelum kenderaan sendiri boleh diperolehi, yang dapat memudahkan lagi proses pembelajaran perancangan.

Pengoptimum Perancangan. Dengan gerakan sebelumnya yang disediakan oleh peramal gerakan, permulaan yang lebih baik diperolehi, menghasilkan lebih sedikit lencongan semasa latihan. Sebagai komponen utama perancang gerakan, reka bentuk fungsi kos adalah penting kerana ia akan mempengaruhi atau bahkan menentukan kualiti prestasi akhir. Dalam perancang gerakan SparseAD yang dicadangkan, dua kekangan utama, keselamatan dan dinamik, dipertimbangkan terutamanya, bertujuan untuk menjana hasil perancangan yang memuaskan. Khususnya, sebagai tambahan kepada kekangan yang ditentukan dalam VAD, ia juga memfokuskan pada hubungan keselamatan dinamik antara kenderaan dan ejen berdekatan, dan mempertimbangkan kedudukan relatif mereka pada detik-detik masa hadapan. Sebagai contoh, jika ejen i terus kekal di kawasan kiri hadapan berbanding kenderaan, dengan itu menghalang kenderaan daripada menukar lorong ke kiri, maka ejen i akan mendapatkan label kiri, menunjukkan bahawa ejen mengenakan kekangan ke kiri pada kenderaan . Oleh itu, kekangan dikelaskan sebagai depan, belakang, atau tiada dalam arah membujur, dan sebagai kiri, kanan, atau tiada dalam arah melintang. Dalam perancang, kami menyahkod perhubungan antara ejen lain dan kenderaan dalam arah mendatar dan menegak daripada pertanyaan yang sepadan. Proses ini melibatkan penentuan kebarangkalian semua kekangan antara ejen lain dan kenderaan sendiri dalam arah ini. Kemudian, kami menggunakan kehilangan fokus sebagai fungsi kos hubungan Ego-Agen (EAR) untuk menangkap potensi risiko yang dibawa oleh ejen berdekatan dengan berkesan:

nuScenes最新SOTA | SparseAD：稀疏查询助力高效端到端自动驾驶！

Memandangkan trajektori yang dirancang mesti mengikut undang-undang dinamik pelaksanaan sistem kawalan, dalam perancangan gerakan Tugas-tugas tambahan dibenamkan dalam mesin untuk menggalakkan pembelajaran keadaan dinamik kenderaan. Nyahkod keadaan seperti halaju, pecutan dan sudut yaw daripada pertanyaan kenderaan sendiri Qego, dan selia keadaan ini menggunakan kehilangan dinamik:

nuScenes最新SOTA | SparseAD：稀疏查询助力高效端到端自动驾驶！

Hasil eksperimen

Eksperimen meluas telah dijalankan ke atas set data keberkesanan dan keberkesanan Prov. keunggulan kaedah. Untuk bersikap adil, prestasi setiap tugas yang lengkap akan dinilai dan dibandingkan dengan kaedah sebelumnya. Percubaan dalam bahagian ini menggunakan tiga konfigurasi berbeza SparseAD, iaitu SparseAD-B dan SparseAD-L yang hanya menggunakan input imej, dan SparseAD-BR yang menggunakan awan titik radar dan input berbilang mod imej. Kedua-dua SparseAD-B dan SparseAD-BR menggunakan V2-99 sebagai rangkaian tulang belakang imej, dan resolusi imej input ialah 1600 × 640. SparseAD-L selanjutnya menggunakan ViTLarge sebagai rangkaian tulang belakang imej, dan resolusi imej input ialah 1600×800.

Hasil pengesanan 3D dan berbilang sasaran 3D pada set data pengesahan nuScenes adalah seperti berikut. "Kaedah penjejakan sahaja" merujuk kepada kaedah yang dijejaki melalui korelasi pasca pemprosesan. "Kaedah pemanduan autonomi hujung ke hujung" merujuk kepada kaedah yang mampu melakukan tugas pemanduan autonomi tindanan penuh. Semua kaedah dalam jadual dinilai dengan input imej resolusi penuh. †: Hasilnya diterbitkan semula melalui kod sumber terbuka rasmi. -R: Menunjukkan bahawa input awan titik radar digunakan. Perbandingan prestasi

nuScenes最新SOTA | SparseAD：稀疏查询助力高效端到端自动驾驶！

dengan kaedah pemetaan dalam talian adalah seperti berikut, keputusan dinilai pada ambang [1.0m, 1.5m, 2.0m]. ‡: Keputusan diterbitkan semula melalui kod sumber terbuka rasmi. †: Berdasarkan keperluan modul perancangan dalam SparseAD, kami membahagikan lagi sempadan kepada segmen dan lorong jalan dan menilainya secara berasingan. ∗: Kos rangkaian tulang belakang dan modul penderiaan jarang. -R: Menunjukkan bahawa input awan titik radar digunakan.

nuScenes最新SOTA | SparseAD：稀疏查询助力高效端到端自动驾驶！

Hasil Pelbagai Tugas

Kesedaran halangan. Prestasi pengesanan dan penjejakan SparseAD dibandingkan dengan kaedah lain pada set pengesahan nuScenes dalam Tab 2. Jelas sekali, SparseAD-B berprestasi baik dalam kebanyakan kaedah pengesanan sahaja, penjejakan sahaja dan hujung ke hujung berbilang objek, sambil berprestasi setanding dengan kaedah SOTA seperti StreamPETR dan QTrack pada tugasan yang sepadan. Dengan meningkatkan rangkaian tulang belakang yang lebih maju, SparseAD-Large mencapai prestasi keseluruhan yang lebih baik, dengan mAP sebanyak 53.6%, NDS sebanyak 62.5% dan AMOTA sebanyak 60.6%, yang secara keseluruhannya lebih baik daripada kaedah terbaik sebelumnya Sparse4Dv3.

Pemetaan dalam talian. Tab. 3 menunjukkan hasil perbandingan prestasi pemetaan dalam talian antara SparseAD dan kaedah sebelumnya yang lain pada set pengesahan nuScenes. Perlu diingatkan bahawa mengikut keperluan perancangan, kami membahagikan sempadan kepada segmen jalan dan lorong dan menilainya secara berasingan, sambil memanjangkan julat dari 60m × 30m biasa kepada 102.4m × 102.4m agar selaras dengan persepsi halangan. Tanpa kehilangan keadilan, SparseAD mencapai 34.2% mAP dalam cara yang jarang dari hujung ke hujung tanpa sebarang perwakilan BEV yang padat, yang lebih baik daripada kebanyakan kaedah popular sebelum ini, seperti HDMapNet, VectorMapNet dan MapTR, dari segi prestasi Ia mempunyai kelebihan yang jelas dalam segi kos dan kos latihan. Walaupun prestasinya lebih rendah sedikit daripada StreamMapNet, kaedah kami menunjukkan bahawa pemetaan dalam talian boleh dilakukan dengan cara yang jarang berlaku tanpa sebarang perwakilan BEV yang padat, yang mempunyai implikasi untuk penggunaan praktikal pemanduan autonomi hujung ke hujung pada kos yang jauh lebih rendah. Diakui, cara menggunakan maklumat berguna daripada modaliti lain (seperti radar) dengan berkesan masih merupakan tugas yang patut diterokai lebih lanjut. Kami percaya masih banyak ruang untuk penerokaan dalam cara yang jarang.

Ramalan Sukan. Hasil perbandingan ramalan gerakan ditunjukkan dalam Tab 4a, di mana penunjuk adalah konsisten dengan VIP3D. SparseAD mencapai prestasi terbaik antara semua kaedah hujung ke hujung, dengan 0.83m minADE terendah, 1.58m minFDE, 18.7% kadar kesilapan dan 0.308 EPA tertinggi, yang merupakan kelebihan yang besar. Di samping itu, terima kasih kepada kecekapan dan kebolehskalaan paradigma pusat pertanyaan jarang, SparseAD boleh menskalakan secara berkesan kepada lebih banyak modaliti dan mendapat manfaat daripada rangkaian tulang belakang lanjutan untuk meningkatkan lagi prestasi ramalan dengan ketara.

Merancang. Keputusan perancangan dibentangkan dalam Tab 4b. Terima kasih kepada reka bentuk unggul modul persepsi huluan dan perancang gerakan, semua versi SparseAD mencapai prestasi terkini pada set data pengesahan nuScenes. Khususnya, SparseAD-B mencapai purata kadar ralat dan perlanggaran L2 terendah berbanding semua kaedah lain termasuk UniAD dan VAD, yang menunjukkan keunggulan pendekatan dan seni bina kami. Sama seperti tugas huluan termasuk persepsi halangan dan ramalan gerakan, SparseAD meningkatkan lagi prestasi dengan radar atau rangkaian tulang belakang yang lebih berkuasa.

nuScenes最新SOTA | SparseAD：稀疏查询助力高效端到端自动驾驶！

Atas ialah kandungan terperinci SOTA terbaharu nuScenes |. SparseAD: Pertanyaan jarang membantu pemanduan autonomi hujung ke hujung yang cekap!. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

Menjana ai hentai secara percuma.

Tunjukkan Lagi

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)

3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Tetapan grafik terbaik

3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Penyelesaian Riddle Seashell

2 minggu yang lalu By DDD

R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa

3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

WWE 2K25: Cara Membuka Segala -galanya Di Myrise

4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Tunjukkan Lagi

Alat panas

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Tunjukkan Lagi

Topik panas

Di manakah pintu masuk log masuk untuk e-mel gmail?

7484

Tutorial CakePHP

1377

Apakah format nama akaun stim

kunci pengaktifan win11 kekal

Sambungan NYT menunjukkan dan jawapan

Tunjukkan Lagi

Related knowledge

Bagaimana untuk menyelesaikan masalah ekor panjang dalam senario pemanduan autonomi? Jun 02, 2024 pm 02:44 PM

Semalam semasa temu bual, saya telah ditanya sama ada saya telah membuat sebarang soalan berkaitan ekor panjang, jadi saya fikir saya akan memberikan ringkasan ringkas. Masalah ekor panjang pemanduan autonomi merujuk kepada kes tepi dalam kenderaan autonomi, iaitu, kemungkinan senario dengan kebarangkalian yang rendah untuk berlaku. Masalah ekor panjang yang dirasakan adalah salah satu sebab utama yang kini mengehadkan domain reka bentuk pengendalian kenderaan autonomi pintar satu kenderaan. Seni bina asas dan kebanyakan isu teknikal pemanduan autonomi telah diselesaikan, dan baki 5% masalah ekor panjang secara beransur-ansur menjadi kunci untuk menyekat pembangunan pemanduan autonomi. Masalah ini termasuk pelbagai senario yang berpecah-belah, situasi yang melampau dan tingkah laku manusia yang tidak dapat diramalkan. "Ekor panjang" senario tepi dalam pemanduan autonomi merujuk kepada kes tepi dalam kenderaan autonomi (AVs) kes Edge adalah senario yang mungkin dengan kebarangkalian yang rendah untuk berlaku. kejadian yang jarang berlaku ini

Langkah terperinci untuk membersihkan memori di Xiaohongshu Apr 26, 2024 am 10:43 AM

1. Buka Xiaohongshu, klik Saya di sudut kanan bawah 2. Klik ikon tetapan, klik Umum 3. Klik Kosongkan Cache

Apa yang perlu dilakukan jika telefon Huawei anda mempunyai memori yang tidak mencukupi (Kaedah praktikal untuk menyelesaikan masalah memori yang tidak mencukupi) Apr 29, 2024 pm 06:34 PM

Memori yang tidak mencukupi pada telefon mudah alih Huawei telah menjadi masalah biasa yang dihadapi oleh ramai pengguna, dengan peningkatan dalam aplikasi mudah alih dan fail media. Untuk membantu pengguna menggunakan sepenuhnya ruang storan telefon bimbit mereka, artikel ini akan memperkenalkan beberapa kaedah praktikal untuk menyelesaikan masalah memori yang tidak mencukupi pada telefon mudah alih Huawei. 1. Bersihkan cache: rekod sejarah dan data tidak sah untuk mengosongkan ruang memori dan mengosongkan fail sementara yang dijana oleh aplikasi. Cari "Storan" dalam tetapan telefon Huawei anda, klik "Kosongkan Cache" dan pilih butang "Kosongkan Cache" untuk memadam fail cache aplikasi. 2. Nyahpasang aplikasi yang jarang digunakan: Untuk mengosongkan ruang memori, padamkan beberapa aplikasi yang jarang digunakan. Seret ia ke bahagian atas skrin telefon, tekan lama ikon "Nyahpasang" aplikasi yang ingin anda padamkan, kemudian klik butang pengesahan untuk menyelesaikan penyahpasangan. 3.Aplikasi mudah alih untuk

Cara menyempurnakan deepseek di dalam negara Feb 19, 2025 pm 05:21 PM

Penalaan setempat model kelas DeepSeek menghadapi cabaran sumber dan kepakaran pengkomputeran yang tidak mencukupi. Untuk menangani cabaran-cabaran ini, strategi berikut boleh diterima pakai: Kuantisasi model: Menukar parameter model ke dalam bilangan bulat ketepatan rendah, mengurangkan jejak memori. Gunakan model yang lebih kecil: Pilih model pretrained dengan parameter yang lebih kecil untuk penalaan halus tempatan yang lebih mudah. Pemilihan data dan pra-proses: Pilih data berkualiti tinggi dan lakukan pra-proses yang sesuai untuk mengelakkan kualiti data yang lemah yang mempengaruhi keberkesanan model. Latihan Batch: Untuk set data yang besar, beban data dalam kelompok untuk latihan untuk mengelakkan limpahan memori. Percepatan dengan GPU: Gunakan kad grafik bebas untuk mempercepatkan proses latihan dan memendekkan masa latihan.

FisheyeDetNet: algoritma pengesanan sasaran pertama berdasarkan kamera fisheye Apr 26, 2024 am 11:37 AM

Pengesanan objek ialah masalah yang agak matang dalam sistem pemanduan autonomi, antaranya pengesanan pejalan kaki adalah salah satu algoritma terawal untuk digunakan. Penyelidikan yang sangat komprehensif telah dijalankan dalam kebanyakan kertas kerja. Walau bagaimanapun, persepsi jarak menggunakan kamera fisheye untuk pandangan sekeliling agak kurang dikaji. Disebabkan herotan jejari yang besar, perwakilan kotak sempadan standard sukar dilaksanakan dalam kamera fisheye. Untuk mengurangkan perihalan di atas, kami meneroka kotak sempadan lanjutan, elips dan reka bentuk poligon am ke dalam perwakilan kutub/sudut dan mentakrifkan metrik mIOU pembahagian contoh untuk menganalisis perwakilan ini. Model fisheyeDetNet yang dicadangkan dengan bentuk poligon mengatasi model lain dan pada masa yang sama mencapai 49.5% mAP pada set data kamera fisheye Valeo untuk pemanduan autonomi

Apa yang perlu dilakukan jika pelayar Edge menggunakan terlalu banyak memori Apa yang perlu dilakukan jika pelayar Edge menggunakan terlalu banyak memori May 09, 2024 am 11:10 AM

1. Mula-mula, masukkan pelayar Edge dan klik tiga titik di penjuru kanan sebelah atas. 2. Kemudian, pilih [Sambungan] dalam bar tugas. 3. Seterusnya, tutup atau nyahpasang pemalam yang anda tidak perlukan.

Dengan hanya $250, pengarah teknikal Hugging Face mengajar anda cara memperhalusi Llama 3 May 06, 2024 pm 03:52 PM

Model bahasa besar sumber terbuka yang biasa seperti Llama3 yang dilancarkan oleh model Meta, Mistral dan Mixtral yang dilancarkan oleh MistralAI, dan Jamba yang dilancarkan oleh AI21 Lab telah menjadi pesaing OpenAI. Dalam kebanyakan kes, pengguna perlu memperhalusi model sumber terbuka ini berdasarkan data mereka sendiri untuk melancarkan potensi model sepenuhnya. Tidak sukar untuk memperhalusi model bahasa besar (seperti Mistral) berbanding model kecil menggunakan Q-Learning pada GPU tunggal, tetapi penalaan halus yang cekap bagi model besar seperti Llama370b atau Mixtral kekal sebagai cabaran sehingga kini . Oleh itu, Philipp Sch, pengarah teknikal HuggingFace

Pembinaan semula statik visual tulen pertama bagi pemanduan autonomi Jun 02, 2024 pm 03:24 PM

Penyelesaian anotasi visual semata-mata menggunakan penglihatan serta beberapa data daripada GPS, IMU dan penderia kelajuan roda untuk anotasi dinamik. Sudah tentu, untuk senario pengeluaran besar-besaran, ia tidak semestinya visual semata-mata. Sesetengah kenderaan yang dihasilkan secara besar-besaran akan mempunyai penderia seperti radar keadaan pepejal (AT128). Jika kami mencipta gelung tertutup data dari perspektif pengeluaran besar-besaran dan menggunakan semua penderia ini, kami boleh menyelesaikan masalah pelabelan objek dinamik dengan berkesan. Tetapi tiada radar keadaan pepejal dalam rancangan kami. Oleh itu, kami akan memperkenalkan penyelesaian pelabelan pengeluaran besar-besaran yang paling biasa ini. Teras penyelesaian anotasi visual semata-mata terletak pada pembinaan semula pose berketepatan tinggi. Kami menggunakan skema pembinaan semula pose Structure from Motion (SFM) untuk memastikan ketepatan pembinaan semula. Tetapi lulus

See all articles