


Perlaksanaan yang dipercepatkan lagi: memampatkan model perancangan gerakan hujung ke hujung pemanduan autonomi
Tajuk asal: On the Road to Portability: Compressing End-to-End Motion Planner for Autonomous Driving
Pautan kertas: https://arxiv.org/pdf/2403.01238.pdf
Pautan kod: https://github .com/tulerfeng/PlanKD
Gabungan pengarang: Institut Teknologi Beijing ALLRIDE.AI Makmal Utama Wilayah Hebei Sains Data Besar dan Teknologi Pintar
Idea tesis
Model perancangan gerakan yang dilengkapi hujung ke hujung dengan rangkaian neural yang mendalam, menunjukkan potensi besar dalam merealisasikan pemanduan autonomi sepenuhnya. Walau bagaimanapun, rangkaian saraf yang terlalu besar menjadikannya tidak sesuai untuk digunakan pada sistem yang dikekang sumber, yang sudah pasti memerlukan lebih banyak masa dan sumber pengkomputeran. Untuk menangani masalah ini, penyulingan pengetahuan menawarkan pendekatan yang menjanjikan dengan memampatkan model dengan meminta model pelajar yang lebih kecil belajar daripada model guru yang lebih besar. Namun begitu, cara menggunakan penyulingan pengetahuan untuk memampatkan perancang gerakan setakat ini belum diterokai. Kertas kerja ini mencadangkan PlanKD, rangka kerja penyulingan pengetahuan pertama yang disesuaikan untuk perancang gerakan hujung-ke-hujung mampatan. Pertama, memandangkan senario pemanduan sememangnya kompleks dan selalunya mengandungi maklumat yang tidak berkaitan perancangan atau bising, ia tidak akan berfaedah bagi perancang pelajar untuk memindahkan maklumat ini. Oleh itu, kertas kerja ini mereka bentuk strategi berdasarkan kesesakan maklumat, yang hanya menyaring maklumat berkaitan perancangan dan bukannya memindahkan semua maklumat secara sembarangan. Kedua, titik jalan yang berbeza dalam trajektori yang dirancang output mungkin berbeza dari segi kepentingan kepada perancangan gerakan, dan sisihan sedikit dalam beberapa titik laluan kritikal boleh menyebabkan perlanggaran. Oleh itu, kertas kerja ini mereka bentuk modul penyulingan perhatian titik laluan yang sedar keselamatan untuk menetapkan pemberat penyesuaian kepada titik laluan yang berbeza berdasarkan kepentingan untuk menggalakkan model pelajar meniru titik laluan yang lebih kritikal dengan lebih tepat, dengan itu meningkatkan keselamatan keseluruhan. Eksperimen menunjukkan bahawa PlanKD kami boleh meningkatkan prestasi perancang kecil dengan ketara dan mengurangkan masa rujukan mereka dengan ketara.
Sumbangan Utama:
- Kertas kerja ini membina percubaan pertama untuk meneroka kaedah penyulingan pengetahuan khusus untuk memampatkan perancang gerakan hujung ke hujung dalam pemanduan autonomi.
- Kertas kerja ini mencadangkan rangka kerja umum dan inovatif PlanKD, yang membolehkan perancang pelajar mewarisi pengetahuan berkaitan perancangan di lapisan tengah dan memudahkan pemadanan tepat titik laluan utama untuk meningkatkan keselamatan.
- Percubaan menunjukkan bahawa PlanKD dalam artikel ini boleh meningkatkan prestasi perancang kecil dengan ketara, dengan itu menyediakan penyelesaian yang lebih mudah alih dan cekap untuk penggunaan dengan sumber yang terhad.
Reka Bentuk Rangkaian:
Perancangan gerakan hujung ke hujung baru-baru ini muncul sebagai hala tuju yang menjanjikan dalam pemanduan autonomi [3, 10, 30, 31, 40, 47, 48], yang secara langsung memetakan data sensor mentah kepada tindakan yang dirancang. Paradigma berasaskan pembelajaran ini mempamerkan kelebihan mengurangkan pergantungan berat pada peraturan buatan tangan dan mengurangkan pengumpulan ralat dalam modul lata yang kompleks (biasanya perancangan pengesanan-ramalan) [40, 48]. Walaupun kejayaan mereka, seni bina besar rangkaian saraf dalam dalam perancang gerakan menimbulkan cabaran untuk penggunaan dalam persekitaran yang dikekang sumber, seperti robot penghantaran autonomi yang bergantung pada kuasa pengkomputeran peranti tepi. Tambahan pula, walaupun dalam kenderaan konvensional, sumber pengkomputeran peranti on-board selalunya terhad [34]. Oleh itu, menggunakan secara langsung perancang yang mendalam dan besar sudah semestinya memerlukan lebih banyak masa dan sumber pengkomputeran, yang menjadikannya mencabar untuk bertindak balas dengan cepat terhadap potensi bahaya. Untuk mengurangkan masalah ini, pendekatan yang mudah adalah untuk mengurangkan bilangan parameter rangkaian dengan menggunakan rangkaian tulang belakang yang lebih kecil, tetapi kertas kerja ini memerhatikan bahawa prestasi model perancangan hujung ke hujung akan menurun secara mendadak, seperti yang ditunjukkan dalam Rajah 1. Sebagai contoh, walaupun masa inferens InterFuser [33], perancang gerakan hujung ke hujung tipikal, telah dikurangkan daripada 52.9M kepada 26.3M, skor pemanduannya juga menurun daripada 53.44 kepada 36.55. Oleh itu, adalah perlu untuk membangunkan kaedah pemampatan model yang sesuai untuk perancangan gerakan hujung ke hujung.
Untuk mendapatkan perancang gerakan mudah alih, kertas kerja ini menggunakan penyulingan pengetahuan [19] untuk memampatkan model perancangan gerakan hujung ke hujung. Penyulingan pengetahuan (KD) telah dikaji secara meluas untuk pemampatan model dalam pelbagai tugas, seperti pengesanan objek [6, 24], segmentasi semantik [18, 28], dsb. Idea asas kerja-kerja ini adalah untuk melatih model pelajar yang dipermudahkan dengan mewarisi pengetahuan daripada model guru yang lebih besar dan menggunakan model pelajar untuk menggantikan model guru semasa penggunaan. Walaupun kajian ini telah mencapai kejayaan yang ketara, penggunaannya secara langsung pada perancangan gerakan hujung ke hujung membawa kepada hasil yang tidak optimum. Ini berpunca daripada dua cabaran yang timbul yang wujud dalam tugas perancangan gerakan: (i) Senario pemanduan bersifat kompleks [46], melibatkan berbilang objek dinamik dan statik, pemandangan latar belakang yang kompleks, dan jalan dan lalu lintas pelbagai rupa Maklumat yang pelbagai termasuk maklumat. Walau bagaimanapun, tidak semua maklumat ini berguna untuk perancangan. Sebagai contoh, bangunan latar belakang dan kenderaan jauh adalah tidak relevan atau bising untuk perancangan [41], manakala kenderaan berhampiran dan lampu isyarat mempunyai kesan yang menentukan. Oleh itu, adalah penting untuk mengekstrak secara automatik maklumat yang berkaitan dengan perancangan daripada model guru, yang kaedah KD sebelumnya tidak dapat dicapai. (ii) Titik jalan yang berbeza dalam trajektori perancangan output biasanya mempunyai kepentingan yang berbeza untuk perancangan gerakan. Contohnya, apabila menavigasi persimpangan, titik laluan dalam trajektori yang berdekatan dengan kenderaan lain mungkin mempunyai kepentingan yang lebih tinggi daripada titik laluan lain. Ini kerana pada titik ini, kenderaan sendiri perlu berinteraksi secara aktif dengan kenderaan lain, malah penyelewengan kecil boleh menyebabkan perlanggaran. Walau bagaimanapun, cara menyesuaikan titik laluan utama dan menirunya dengan tepat adalah satu lagi cabaran utama kaedah KD sebelumnya.
Untuk menangani dua cabaran di atas, kertas kerja ini mencadangkan kaedah penyulingan pengetahuan pertama yang disesuaikan untuk perancang gerakan hujung ke hujung dalam pemanduan autonomi termampat, dipanggil PlanKD. Pertama, kertas kerja ini mencadangkan strategi berdasarkan prinsip kesesakan maklumat [2], yang matlamatnya adalah untuk mengekstrak ciri berkaitan perancangan yang mengandungi maklumat perancangan yang minimum dan mencukupi. Secara khusus, kertas kerja ini memaksimumkan maklumat bersama antara ciri berkaitan perancangan yang diekstrak dan nilai sebenar keadaan perancangan yang ditakrifkan dalam kertas ini, sambil meminimumkan maklumat bersama antara ciri yang diekstrak dan peta ciri perantaraan. Strategi ini membolehkan kertas kerja ini mengeluarkan maklumat berkaitan perancangan kritikal hanya pada lapisan tengah, dengan itu meningkatkan keberkesanan model pelajar. Kedua, untuk mengenal pasti titik laluan utama secara dinamik dan menirunya dengan setia, makalah ini menggunakan mekanisme perhatian [38] untuk mengira setiap titik laluan dan berat perhatiannya di antaranya dan konteks yang berkaitan dalam Pandangan Mata Burung (BEV). Untuk menggalakkan peniruan tepat bagi titik laluan kritikal keselamatan semasa penyulingan, kami mereka bentuk kehilangan kedudukan sedar keselamatan yang menggalakkan memberikan berat perhatian yang lebih tinggi kepada titik laluan yang hampir dengan halangan bergerak. Sehubungan itu, keselamatan perancang pelajar boleh dipertingkatkan dengan ketara. Bukti yang ditunjukkan dalam Rajah 1 menunjukkan bahawa skor pemanduan perancang pelajar boleh dipertingkatkan dengan ketara dengan PlanKD kami. Tambahan pula, kaedah kami boleh mengurangkan masa rujukan kira-kira 50% sambil mengekalkan prestasi yang setanding dengan perancang guru pada Penanda Aras Panjang Town05.
Rajah 1. Gambar rajah skema kemerosotan prestasi InterFuser[33] apabila bilangan parameter berkurangan pada Penanda Aras Panjang Town05 [31]. Dengan memanfaatkan PlanKD kami, kami boleh meningkatkan prestasi perancang gerakan padat dan mengurangkan masa rujukan dengan ketara. Masa inferens dinilai pada GPU GeForce RTX 3090 pada pelayan.
Rajah 2. Gambar rajah skema rangka kerja PlanKD artikel ini. PlanKD terdiri daripada dua modul: modul penyulingan ciri berkaitan perancangan yang mengekstrak ciri berkaitan perancangan daripada peta ciri perantaraan melalui kesesakan maklumat (IB) modul penyulingan perhatian titik laluan yang sedar keselamatan yang menentukan titik laluan utama dan Ekstrak pengetahuan daripadanya secara dinamik kepadanya; meningkatkan keselamatan keseluruhan.
Hasil eksperimen:
Rajah 3. Visualisasi berat perhatian yang mementingkan keselamatan dalam senario pemanduan yang berbeza. Blok hijau mewakili kenderaan ego dan blok kuning mewakili pengguna jalan raya lain (cth. kereta, basikal). Semakin merah titik laluan, semakin tinggi berat perhatiannya.
Ringkasan:
Kertas kerja ini mencadangkan PlanKD, kaedah penyulingan pengetahuan yang disesuaikan untuk perancang gerakan hujung-ke-hujung mampatan. Kaedah yang dicadangkan boleh mempelajari ciri berkaitan perancangan melalui kesesakan maklumat untuk mencapai penyulingan ciri yang berkesan. Tambahan pula, kertas kerja ini mereka bentuk mekanisme penyulingan titik laluan yang sedar keselamatan untuk menentukan secara adaptif kepentingan setiap titik laluan untuk penyulingan titik laluan. Eksperimen yang meluas mengesahkan keberkesanan pendekatan kami, menunjukkan bahawa PlanKD boleh berfungsi sebagai penyelesaian mudah alih dan selamat untuk penggunaan terhad sumber.
Petikan:
Feng K, Li C, Ren D, et al Dalam Jalan Menuju Mudah Alih: Memampatkan Perancang Pergerakan Hujung-ke-Hujung untuk Pemanduan Autonomi[J].
Atas ialah kandungan terperinci Perlaksanaan yang dipercepatkan lagi: memampatkan model perancangan gerakan hujung ke hujung pemanduan autonomi. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

Video Face Swap
Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas











Bayangkan model kecerdasan buatan yang bukan sahaja mempunyai keupayaan untuk mengatasi pengkomputeran tradisional, tetapi juga mencapai prestasi yang lebih cekap pada kos yang lebih rendah. Ini bukan fiksyen sains, DeepSeek-V2[1], model MoE sumber terbuka paling berkuasa di dunia ada di sini. DeepSeek-V2 ialah gabungan model bahasa pakar (MoE) yang berkuasa dengan ciri-ciri latihan ekonomi dan inferens yang cekap. Ia terdiri daripada 236B parameter, 21B daripadanya digunakan untuk mengaktifkan setiap penanda. Berbanding dengan DeepSeek67B, DeepSeek-V2 mempunyai prestasi yang lebih kukuh, sambil menjimatkan 42.5% kos latihan, mengurangkan cache KV sebanyak 93.3% dan meningkatkan daya pemprosesan penjanaan maksimum kepada 5.76 kali. DeepSeek ialah sebuah syarikat yang meneroka kecerdasan buatan am

Semalam semasa temu bual, saya telah ditanya sama ada saya telah membuat sebarang soalan berkaitan ekor panjang, jadi saya fikir saya akan memberikan ringkasan ringkas. Masalah ekor panjang pemanduan autonomi merujuk kepada kes tepi dalam kenderaan autonomi, iaitu, kemungkinan senario dengan kebarangkalian yang rendah untuk berlaku. Masalah ekor panjang yang dirasakan adalah salah satu sebab utama yang kini mengehadkan domain reka bentuk pengendalian kenderaan autonomi pintar satu kenderaan. Seni bina asas dan kebanyakan isu teknikal pemanduan autonomi telah diselesaikan, dan baki 5% masalah ekor panjang secara beransur-ansur menjadi kunci untuk menyekat pembangunan pemanduan autonomi. Masalah ini termasuk pelbagai senario yang berpecah-belah, situasi yang melampau dan tingkah laku manusia yang tidak dapat diramalkan. "Ekor panjang" senario tepi dalam pemanduan autonomi merujuk kepada kes tepi dalam kenderaan autonomi (AVs) kes Edge adalah senario yang mungkin dengan kebarangkalian yang rendah untuk berlaku. kejadian yang jarang berlaku ini

AI memang mengubah matematik. Baru-baru ini, Tao Zhexuan, yang telah mengambil perhatian terhadap isu ini, telah memajukan keluaran terbaru "Buletin Persatuan Matematik Amerika" (Buletin Persatuan Matematik Amerika). Memfokuskan pada topik "Adakah mesin akan mengubah matematik?", ramai ahli matematik menyatakan pendapat mereka Seluruh proses itu penuh dengan percikan api, tegar dan menarik. Penulis mempunyai barisan yang kuat, termasuk pemenang Fields Medal Akshay Venkatesh, ahli matematik China Zheng Lejun, saintis komputer NYU Ernest Davis dan ramai lagi sarjana terkenal dalam industri. Dunia AI telah berubah secara mendadak Anda tahu, banyak artikel ini telah dihantar setahun yang lalu.

Prestasi JAX, yang dipromosikan oleh Google, telah mengatasi Pytorch dan TensorFlow dalam ujian penanda aras baru-baru ini, menduduki tempat pertama dalam 7 penunjuk. Dan ujian tidak dilakukan pada TPU dengan prestasi JAX terbaik. Walaupun dalam kalangan pembangun, Pytorch masih lebih popular daripada Tensorflow. Tetapi pada masa hadapan, mungkin lebih banyak model besar akan dilatih dan dijalankan berdasarkan platform JAX. Model Baru-baru ini, pasukan Keras menanda aras tiga hujung belakang (TensorFlow, JAX, PyTorch) dengan pelaksanaan PyTorch asli dan Keras2 dengan TensorFlow. Pertama, mereka memilih satu set arus perdana

Boston Dynamics Atlas secara rasmi memasuki era robot elektrik! Semalam, Atlas hidraulik hanya "menangis" menarik diri daripada peringkat sejarah Hari ini, Boston Dynamics mengumumkan bahawa Atlas elektrik sedang berfungsi. Nampaknya dalam bidang robot humanoid komersial, Boston Dynamics berazam untuk bersaing dengan Tesla. Selepas video baharu itu dikeluarkan, ia telah pun ditonton oleh lebih sejuta orang dalam masa sepuluh jam sahaja. Orang lama pergi dan peranan baru muncul. Ini adalah keperluan sejarah. Tidak dinafikan bahawa tahun ini adalah tahun letupan robot humanoid. Netizen mengulas: Kemajuan robot telah menjadikan majlis pembukaan tahun ini kelihatan seperti manusia, dan tahap kebebasan adalah jauh lebih besar daripada manusia Tetapi adakah ini benar-benar bukan filem seram? Pada permulaan video, Atlas berbaring dengan tenang di atas tanah, seolah-olah terlentang. Apa yang berikut adalah rahang-jatuh

Awal bulan ini, penyelidik dari MIT dan institusi lain mencadangkan alternatif yang sangat menjanjikan kepada MLP - KAN. KAN mengatasi MLP dari segi ketepatan dan kebolehtafsiran. Dan ia boleh mengatasi prestasi MLP berjalan dengan bilangan parameter yang lebih besar dengan bilangan parameter yang sangat kecil. Sebagai contoh, penulis menyatakan bahawa mereka menggunakan KAN untuk menghasilkan semula keputusan DeepMind dengan rangkaian yang lebih kecil dan tahap automasi yang lebih tinggi. Khususnya, MLP DeepMind mempunyai kira-kira 300,000 parameter, manakala KAN hanya mempunyai kira-kira 200 parameter. KAN mempunyai asas matematik yang kukuh seperti MLP berdasarkan teorem penghampiran universal, manakala KAN berdasarkan teorem perwakilan Kolmogorov-Arnold. Seperti yang ditunjukkan dalam rajah di bawah, KAN telah

Video terbaru robot Tesla Optimus dikeluarkan, dan ia sudah boleh berfungsi di kilang. Pada kelajuan biasa, ia mengisih bateri (bateri 4680 Tesla) seperti ini: Pegawai itu juga mengeluarkan rupanya pada kelajuan 20x - pada "stesen kerja" kecil, memilih dan memilih dan memilih: Kali ini ia dikeluarkan Salah satu sorotan video itu ialah Optimus menyelesaikan kerja ini di kilang, sepenuhnya secara autonomi, tanpa campur tangan manusia sepanjang proses. Dan dari perspektif Optimus, ia juga boleh mengambil dan meletakkan bateri yang bengkok, memfokuskan pada pembetulan ralat automatik: Berkenaan tangan Optimus, saintis NVIDIA Jim Fan memberikan penilaian yang tinggi: Tangan Optimus adalah robot lima jari di dunia paling cerdik. Tangannya bukan sahaja boleh disentuh

Pautan projek ditulis di hadapan: https://nianticlabs.github.io/mickey/ Memandangkan dua gambar, pose kamera di antara mereka boleh dianggarkan dengan mewujudkan kesesuaian antara gambar. Biasanya, surat-menyurat ini adalah 2D hingga 2D, dan anggaran pose kami adalah skala-tak tentu. Sesetengah aplikasi, seperti realiti tambahan segera pada bila-bila masa, di mana-mana sahaja, memerlukan anggaran pose metrik skala, jadi mereka bergantung pada penganggar kedalaman luaran untuk memulihkan skala. Makalah ini mencadangkan MicKey, proses pemadanan titik utama yang mampu meramalkan korespondensi metrik dalam ruang kamera 3D. Dengan mempelajari padanan koordinat 3D merentas imej, kami dapat membuat kesimpulan relatif metrik
