


SIMPL: Penanda aras ramalan gerakan berbilang ejen yang mudah dan cekap untuk pemanduan autonomi
Tajuk asal: SIMPL: Garis Dasar Ramalan Pergerakan Pelbagai Agen yang Mudah dan Cekap untuk Pemanduan Autonomi
Pautan kertas: https://arxiv.org/pdf/2402.02519.pdf
Pautan kod: https://github.com /HKUST-Aerial-Robotics/SIMPL
Gabungan pengarang: Hong Kong University of Science and Technology DJI
Idea tesis:
Kertas ini mencadangkan garis dasar ramalan pergerakan kenderaan yang mudah dan cekap (SIMPL) autonomi Tidak seperti kaedah tertumpu ejen tradisional (yang mempunyai ketepatan yang tinggi tetapi memerlukan pengiraan berulang) dan kaedah tertumpu kepada pemandangan (di mana ketepatan dan keluasan terjejas), SIMPL boleh menyediakan penyelesaian yang komprehensif untuk semua trafik yang berkaitan. Untuk meningkatkan ketepatan dan kelajuan inferens, kertas kerja ini mencadangkan modul gabungan ciri global yang padat dan cekap yang melaksanakan penghantaran mesej terarah secara simetri, membolehkan rangkaian meramalkan gerakan masa depan semua pengguna jalan raya dalam satu hantaran ke hadapan dan mengurangkan ketepatan kerugian yang disebabkan oleh pergerakan sudut pandangan. Tambahan pula, kertas kerja ini menyiasat penggunaan polinomial asas Bernstein untuk parameterisasi trajektori berterusan dalam penyahkodan trajektori, membenarkan penilaian keadaan dan derivatif tertib tinggi mereka pada sebarang titik masa yang dikehendaki, yang berharga untuk tugas perancangan hiliran. Sebagai garis dasar yang kukuh, SIMPL menunjukkan prestasi yang sangat kompetitif pada penanda aras ramalan gerakan Argoverse 1 dan 2 berbanding kaedah terkini yang lain. Tambahan pula, reka bentuknya yang ringan dan kependaman inferens yang rendah menjadikan SIMPL sangat berskala dan menjanjikan untuk penggunaan udara dunia sebenar.
Reka Bentuk Rangkaian:
Meramalkan pergerakan peserta trafik di sekeliling adalah penting untuk kenderaan autonomi, terutamanya dalam modul membuat keputusan dan perancangan hiliran. Ramalan niat dan trajektori yang tepat akan meningkatkan keselamatan dan keselesaan perjalanan.
Untuk ramalan gerakan berasaskan pembelajaran, salah satu topik yang paling penting ialah perwakilan konteks. Kaedah awal biasanya mewakili pemandangan sekeliling sebagai imej pandangan mata burung berbilang saluran [1]–[4]. Sebaliknya, penyelidikan baru-baru ini semakin menggunakan perwakilan pemandangan vektor [5]-[13], di mana lokasi dan geometri dianotasi menggunakan set titik atau garis poli dengan koordinat geografi, dengan itu meningkatkan kesetiaan dan mengembangkan medan penerimaan. Walau bagaimanapun, untuk perwakilan raster dan vektor, terdapat persoalan utama: bagaimanakah kita harus memilih bingkai rujukan yang sesuai untuk semua elemen ini? Pendekatan yang mudah adalah untuk menerangkan semua kejadian dalam sistem koordinat yang dikongsi (berpusat di tempat kejadian), seperti yang berpusat pada kenderaan autonomi, dan menggunakan koordinat secara langsung sebagai ciri input. Ini membolehkan kami membuat ramalan untuk berbilang ejen sasaran dalam satu hantaran ke hadapan [8, 14]. Walau bagaimanapun, menggunakan koordinat global sebagai input, ramalan biasanya dibuat untuk berbilang ejen sasaran dalam satu hantaran ke hadapan [8, 14]. Walau bagaimanapun, menggunakan koordinat global sebagai input (yang selalunya berbeza-beza dalam julat yang luas) akan memburukkan lagi kerumitan tugasan yang wujud, mengakibatkan prestasi rangkaian merosot dan kebolehsuaian terhad kepada senario baharu. Untuk meningkatkan ketepatan dan keteguhan, penyelesaian biasa adalah untuk menormalkan konteks adegan mengikut keadaan semasa ejen sasaran [5, 7, 10]-[13] (ejen-sentris). Ini bermakna proses penormalan dan pengekodan ciri mesti dilakukan berulang kali untuk setiap ejen sasaran, yang membawa kepada prestasi yang lebih baik dengan mengorbankan pengiraan berlebihan. Oleh itu, adalah perlu untuk meneroka kaedah yang boleh mengekodkan ciri berbilang objek dengan berkesan sambil mengekalkan keteguhan kepada perubahan perspektif.
Untuk modul hiliran ramalan gerakan, seperti membuat keputusan dan perancangan gerakan, bukan sahaja kedudukan masa depan perlu dipertimbangkan, tetapi juga tajuk, kelajuan dan derivatif peringkat tinggi lain perlu dipertimbangkan. Sebagai contoh, tajuk ramalan kenderaan sekeliling memainkan peranan penting dalam membentuk penghunian ruang masa masa hadapan, yang merupakan faktor utama dalam memastikan perancangan gerakan yang selamat dan mantap [15, 16]. Tambahan pula, meramalkan kuantiti pesanan tinggi secara bebas tanpa mematuhi kekangan fizikal boleh membawa kepada keputusan ramalan yang tidak konsisten [17, 18]. Sebagai contoh, walaupun halaju adalah sifar, ia mungkin menghasilkan anjakan kedudukan yang mengelirukan modul perancangan.
Artikel ini memperkenalkan kaedah yang dipanggil SIMPL (Simple and Efficient Motion Prediction Baseline) untuk menyelesaikan isu utama ramalan trajektori berbilang ejen dalam sistem pemanduan autonomi. Kaedah ini mula-mula menggunakan perwakilan adegan berpusatkan contoh dan kemudian memperkenalkan teknologi Transformer gabungan simetri (SFT), yang mampu meramalkan trajektori semua ejen secara berkesan dalam satu hantaran ke hadapan sambil mengekalkan ketepatan dan keteguhan kepada invarian perspektif. Berbanding dengan kaedah lain berdasarkan gabungan konteks simetri, SFT lebih ringkas, lebih ringan dan lebih mudah untuk dilaksanakan, menjadikannya sesuai untuk digunakan dalam persekitaran kenderaan.
Kedua, kertas kerja ini memperkenalkan kaedah parameterisasi baru untuk trajektori yang diramalkan berdasarkan polinomial asas Bernstein (juga dikenali sebagai lengkung Bezier). Perwakilan berterusan ini memastikan kelancaran dan membolehkan penilaian mudah bagi keadaan tepat dan terbitan tertib tingginya pada bila-bila masa tertentu. Kajian empirikal kertas ini menunjukkan bahawa pembelajaran untuk meramal titik kawalan keluk Bezier adalah lebih cekap dan stabil dari segi berangka daripada menganggarkan pekali polinomial asas monomial.
Akhir sekali, komponen yang dicadangkan disepadukan dengan baik ke dalam model yang ringkas namun cekap. Makalah ini menilai kaedah yang dicadangkan pada dua set data ramalan gerakan berskala besar [22, 23], dan keputusan eksperimen menunjukkan bahawa SIMPL sangat berdaya saing dengan kaedah terkini yang lain walaupun reka bentuknya dipermudahkan. Lebih penting lagi, SIMPL membolehkan ramalan trajektori berbilang ejen yang cekap dengan parameter yang boleh dipelajari yang lebih sedikit dan kependaman inferens yang lebih rendah tanpa mengorbankan prestasi kuantifikasi, yang menjanjikan penggunaan udara dunia sebenar. Kertas ini juga menyerlahkan bahawa, sebagai garis dasar yang kukuh, SIMPL sangat berskala. Seni bina ringkas memudahkan penyepaduan langsung dengan kemajuan terkini dalam ramalan gerakan, memberikan peluang untuk meningkatkan lagi prestasi keseluruhan.
Rajah 1: Ilustrasi ramalan gerakan berbilang ejen dalam senario pemanduan yang kompleks. Pendekatan kami mampu menjana hipotesis yang munasabah untuk semua ejen yang berkaitan secara serentak dalam masa nyata. Kenderaan anda sendiri dan kenderaan lain ditunjukkan dalam warna merah dan biru masing-masing. Gunakan warna kecerunan untuk menggambarkan trajektori yang diramalkan berdasarkan cap masa. Sila rujuk video yang dilampirkan untuk lebih banyak contoh.
Rajah 2: Skema SIMPL. Artikel ini menggunakan seni bina rangkaian yang paling mudah untuk menunjukkan keberkesanannya. Ciri setempat bagi tika semantik diproses oleh pengekod ringkas, manakala ciri antara tikar dikekalkan dalam benam kedudukan relatif. Keputusan ramalan trajektori multimodal dijana oleh penyahkod gerakan selepas Transformer ciri simetri yang dicadangkan.
Rajah 3: Gambarajah skematik pengiraan pose relatif.
Rajah 4: Ilustrasi pengubah gabungan simetri (SFT) yang dicadangkan. Token contoh dan benam kedudukan relatif (RPE) dikemas kini secara kitaran dalam setiap lapisan SFT.
Rajah 5: Lengkung Bezier septik 2D (kiri).
Hasil eksperimen:
Artikel ini mencadangkan pelbagai pemanduan autonomi yang mudah dan cekap tujuan Garis asas untuk ramalan gerakan ejen. Menggunakan pengubah gabungan simetri yang dicadangkan, kaedah yang dicadangkan mencapai gabungan ciri global yang cekap dan mengekalkan keteguhan terhadap pergerakan sudut pandang. Parameterisasi trajektori berterusan berdasarkan polinomial asas Bernstein memberikan keserasian yang lebih tinggi dengan modul hiliran. Keputusan percubaan pada set data awam berskala besar menunjukkan bahawa SIMPL mempunyai kelebihan dalam saiz model dan kelajuan inferens sambil mencapai tahap ketepatan yang sama seperti kaedah terkini yang lain.
Petikan:Zhang L, Li P, Liu S, et al SIMPL: Garis Dasar Ramalan Pergerakan Berbilang Agen yang Mudah dan Cekap untuk Pemanduan Autonomi[J].
Atas ialah kandungan terperinci SIMPL: Penanda aras ramalan gerakan berbilang ejen yang mudah dan cekap untuk pemanduan autonomi. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

AI Hentai Generator
Menjana ai hentai secara percuma.

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas



Ditulis di atas & pemahaman peribadi pengarang Gaussiansplatting tiga dimensi (3DGS) ialah teknologi transformatif yang telah muncul dalam bidang medan sinaran eksplisit dan grafik komputer dalam beberapa tahun kebelakangan ini. Kaedah inovatif ini dicirikan oleh penggunaan berjuta-juta Gaussians 3D, yang sangat berbeza daripada kaedah medan sinaran saraf (NeRF), yang terutamanya menggunakan model berasaskan koordinat tersirat untuk memetakan koordinat spatial kepada nilai piksel. Dengan perwakilan adegan yang eksplisit dan algoritma pemaparan yang boleh dibezakan, 3DGS bukan sahaja menjamin keupayaan pemaparan masa nyata, tetapi juga memperkenalkan tahap kawalan dan pengeditan adegan yang tidak pernah berlaku sebelum ini. Ini meletakkan 3DGS sebagai penukar permainan yang berpotensi untuk pembinaan semula dan perwakilan 3D generasi akan datang. Untuk tujuan ini, kami menyediakan gambaran keseluruhan sistematik tentang perkembangan dan kebimbangan terkini dalam bidang 3DGS buat kali pertama.

Semalam semasa temu bual, saya telah ditanya sama ada saya telah membuat sebarang soalan berkaitan ekor panjang, jadi saya fikir saya akan memberikan ringkasan ringkas. Masalah ekor panjang pemanduan autonomi merujuk kepada kes tepi dalam kenderaan autonomi, iaitu, kemungkinan senario dengan kebarangkalian yang rendah untuk berlaku. Masalah ekor panjang yang dirasakan adalah salah satu sebab utama yang kini mengehadkan domain reka bentuk pengendalian kenderaan autonomi pintar satu kenderaan. Seni bina asas dan kebanyakan isu teknikal pemanduan autonomi telah diselesaikan, dan baki 5% masalah ekor panjang secara beransur-ansur menjadi kunci untuk menyekat pembangunan pemanduan autonomi. Masalah ini termasuk pelbagai senario yang berpecah-belah, situasi yang melampau dan tingkah laku manusia yang tidak dapat diramalkan. "Ekor panjang" senario tepi dalam pemanduan autonomi merujuk kepada kes tepi dalam kenderaan autonomi (AVs) kes Edge adalah senario yang mungkin dengan kebarangkalian yang rendah untuk berlaku. kejadian yang jarang berlaku ini

0. Ditulis di hadapan&& Pemahaman peribadi bahawa sistem pemanduan autonomi bergantung pada persepsi lanjutan, membuat keputusan dan teknologi kawalan, dengan menggunakan pelbagai penderia (seperti kamera, lidar, radar, dll.) untuk melihat persekitaran sekeliling dan menggunakan algoritma dan model untuk analisis masa nyata dan membuat keputusan. Ini membolehkan kenderaan mengenali papan tanda jalan, mengesan dan menjejaki kenderaan lain, meramalkan tingkah laku pejalan kaki, dsb., dengan itu selamat beroperasi dan menyesuaikan diri dengan persekitaran trafik yang kompleks. Teknologi ini kini menarik perhatian meluas dan dianggap sebagai kawasan pembangunan penting dalam pengangkutan masa depan satu. Tetapi apa yang menyukarkan pemanduan autonomi ialah memikirkan cara membuat kereta itu memahami perkara yang berlaku di sekelilingnya. Ini memerlukan algoritma pengesanan objek tiga dimensi dalam sistem pemanduan autonomi boleh melihat dan menerangkan dengan tepat objek dalam persekitaran sekeliling, termasuk lokasinya,

Jangan ubah maksud kandungan asal, perhalusi kandungan, tulis semula kandungan dan jangan teruskan. "Regression kuantil memenuhi keperluan ini, menyediakan selang ramalan dengan peluang yang dikira. Ia adalah teknik statistik yang digunakan untuk memodelkan hubungan antara pembolehubah peramal dan pembolehubah tindak balas, terutamanya apabila taburan bersyarat pembolehubah tindak balas adalah menarik Apabila. Tidak seperti regresi tradisional kaedah, regresi kuantil memfokuskan pada menganggar magnitud bersyarat pembolehubah bergerak balas dan bukannya min bersyarat "Rajah (A): Regresi kuantil Regresi kuantil ialah anggaran. Kaedah pemodelan untuk hubungan linear antara set regresi X dan kuantil. daripada pembolehubah yang dijelaskan Y. Model regresi yang sedia ada sebenarnya adalah kaedah untuk mengkaji hubungan antara pembolehubah yang dijelaskan dan pembolehubah penjelasan. Mereka memberi tumpuan kepada hubungan antara pembolehubah penjelasan dan pembolehubah yang dijelaskan

Ramalan trajektori memainkan peranan penting dalam pemanduan autonomi Ramalan trajektori pemanduan autonomi merujuk kepada meramalkan trajektori pemanduan masa hadapan kenderaan dengan menganalisis pelbagai data semasa proses pemanduan kenderaan. Sebagai modul teras pemanduan autonomi, kualiti ramalan trajektori adalah penting untuk kawalan perancangan hiliran. Tugas ramalan trajektori mempunyai timbunan teknologi yang kaya dan memerlukan kebiasaan dengan persepsi dinamik/statik pemanduan autonomi, peta ketepatan tinggi, garisan lorong, kemahiran seni bina rangkaian saraf (CNN&GNN&Transformer), dll. Sangat sukar untuk bermula! Ramai peminat berharap untuk memulakan ramalan trajektori secepat mungkin dan mengelakkan perangkap Hari ini saya akan mengambil kira beberapa masalah biasa dan kaedah pembelajaran pengenalan untuk ramalan trajektori! Pengetahuan berkaitan pengenalan 1. Adakah kertas pratonton teratur? A: Tengok survey dulu, hlm

Tajuk asal: SIMPL: ASimpleandEfficientMulti-agentMotionPredictionBaselineforAutonomousDriving Paper pautan: https://arxiv.org/pdf/2402.02519.pdf Pautan kod: https://github.com/HKUST-Aerial-Robotics/SIMPL Unit pengarang: Universiti Sains Hong Kong dan Teknologi Idea Kertas DJI: Kertas kerja ini mencadangkan garis dasar ramalan pergerakan (SIMPL) yang mudah dan cekap untuk kenderaan autonomi. Berbanding dengan agen-sen tradisional

Ditulis di hadapan & titik permulaan Paradigma hujung ke hujung menggunakan rangka kerja bersatu untuk mencapai pelbagai tugas dalam sistem pemanduan autonomi. Walaupun kesederhanaan dan kejelasan paradigma ini, prestasi kaedah pemanduan autonomi hujung ke hujung pada subtugas masih jauh ketinggalan berbanding kaedah tugasan tunggal. Pada masa yang sama, ciri pandangan mata burung (BEV) padat yang digunakan secara meluas dalam kaedah hujung ke hujung sebelum ini menyukarkan untuk membuat skala kepada lebih banyak modaliti atau tugasan. Paradigma pemanduan autonomi hujung ke hujung (SparseAD) tertumpu carian jarang dicadangkan di sini, di mana carian jarang mewakili sepenuhnya keseluruhan senario pemanduan, termasuk ruang, masa dan tugas, tanpa sebarang perwakilan BEV yang padat. Khususnya, seni bina jarang bersatu direka bentuk untuk kesedaran tugas termasuk pengesanan, penjejakan dan pemetaan dalam talian. Di samping itu, berat

Pada bulan lalu, atas sebab-sebab yang diketahui umum, saya telah mengadakan pertukaran yang sangat intensif dengan pelbagai guru dan rakan sekelas dalam industri. Topik yang tidak dapat dielakkan dalam pertukaran secara semula jadi adalah hujung ke hujung dan Tesla FSDV12 yang popular. Saya ingin mengambil kesempatan ini untuk menyelesaikan beberapa buah fikiran dan pendapat saya pada masa ini untuk rujukan dan perbincangan anda. Bagaimana untuk mentakrifkan sistem pemanduan autonomi hujung ke hujung, dan apakah masalah yang sepatutnya dijangka diselesaikan hujung ke hujung? Menurut definisi yang paling tradisional, sistem hujung ke hujung merujuk kepada sistem yang memasukkan maklumat mentah daripada penderia dan secara langsung mengeluarkan pembolehubah yang membimbangkan tugas. Sebagai contoh, dalam pengecaman imej, CNN boleh dipanggil hujung-ke-hujung berbanding kaedah pengekstrak ciri + pengelas tradisional. Dalam tugas pemanduan autonomi, masukkan data daripada pelbagai penderia (kamera/LiDAR
