Semakan! Ringkaskan secara menyeluruh peranan penting model asas dalam mempromosikan pemanduan autonomi-AI-php.cn

Baru-baru ini, dengan perkembangan dan penemuan teknologi pembelajaran mendalam, model asas berskala besar telah mencapai hasil yang ketara dalam bidang pemprosesan bahasa semula jadi dan hasil penglihatan komputer. Aplikasi model asas dalam pemanduan autonomi juga mempunyai prospek pembangunan yang hebat, yang boleh meningkatkan pemahaman dan penaakulan senario.

Melalui pra-latihan tentang bahasa yang kaya dan data visual, model asas boleh memahami dan mentafsir pelbagai elemen dalam senario pemanduan autonomi dan melakukan penaakulan, menyediakan arahan bahasa dan tindakan untuk memandu membuat keputusan dan perancangan.
Model asas boleh mencapai penambahan data berdasarkan pemahaman senario pemanduan, dan digunakan untuk menyediakan senario jarang yang boleh dilaksanakan dalam pengedaran ekor panjang yang tidak mungkin ditemui semasa pemanduan biasa dan pengumpulan data untuk mencapai ketepatan sistem pemanduan autonomi yang lebih baik dan tujuan kebolehpercayaan.
Satu lagi senario untuk menggunakan model asas ialah model dunia, yang menunjukkan keupayaan untuk memahami undang-undang fizikal dan perkara yang dinamik. Dengan menggunakan paradigma pembelajaran yang diselia sendiri untuk belajar daripada data besar-besaran, model dunia boleh menjana pemandangan pemanduan yang tidak kelihatan tetapi boleh dipercayai, menggalakkan peningkatan ramalan tingkah laku objek dinamik dan proses latihan luar talian bagi strategi pemanduan.

Artikel ini terutamanya menggariskan aplikasi model asas dalam bidang pemanduan autonomi, dan berdasarkan aplikasi model asas dalam model pemanduan autonomi, aplikasi model asas dalam peningkatan data, dan aplikasi model dunia dalam model asas kepada pemanduan autonomi Perluas dari segi aspek. Dari segi model pemanduan autonomi, model asas boleh digunakan untuk melaksanakan pelbagai fungsi pemanduan autonomi, seperti persepsi kenderaan, membuat keputusan dan kawalan. Melalui model asas, kenderaan boleh mendapatkan maklumat tentang persekitaran sekeliling dan membuat keputusan dan tindakan kawalan yang sepadan. Dari segi peningkatan data, model asas boleh digunakan untuk meningkatkan data

Pautan artikel ini: https://arxiv.org/pdf/2405.02288

Model pemanduan autonomi

Pemanduan seperti manusia berdasarkan bahasa dan model asas penglihatan

Dalam pemanduan autonomi, model asas bahasa dan penglihatan telah menunjukkan potensi aplikasi yang hebat Dengan meningkatkan pemahaman dan penaakulan model pemanduan autonomi dalam senario pemanduan, pemanduan autonomi seperti manusia boleh dicapai. Rajah di bawah menunjukkan pemahaman adegan pemanduan oleh model asas berdasarkan bahasa dan penglihatan dan alasan memberi arahan berpandukan bahasa dan tingkah laku pemanduan.

Semakan! Ringkaskan secara menyeluruh peranan penting model asas dalam mempromosikan pemanduan autonomi

Model asas meningkatkan paradigma model pemanduan autonomi

Banyak karya telah membuktikan bahawa bahasa dan ciri visual dapat meningkatkan pemahaman model tentang adegan pemanduan secara berkesan Setelah memperoleh pemahaman persepsi keseluruhan tentang persekitaran semasa, model asas akan Memberi satu siri perintah bahasa, seperti: "Ada lampu merah di hadapan, perlahan dan pandu perlahan", "Ada persimpangan di hadapan, perhatikan pejalan kaki" dan arahan bahasa lain yang berkaitan, supaya pemanduan sendiri kereta boleh melakukan tingkah laku pemanduan akhir mengikut arahan bahasa yang berkaitan.

Dalam beberapa tahun kebelakangan ini, ahli akademik dan industri telah membenamkan pengetahuan bahasa GPT ke dalam proses membuat keputusan pemanduan autonomi. Meningkatkan prestasi pemanduan autonomi dalam bentuk arahan bahasa untuk mempromosikan aplikasi dalam pemanduan autonomi model besar. Memandangkan model besar itu dijangka benar-benar digunakan pada bahagian kenderaan, ia akhirnya perlu mengikut arahan perancangan atau kawalan, dan model asas akhirnya harus membenarkan pemanduan autonomi dari peringkat keadaan tindakan. Sesetengah sarjana telah membuat penerokaan awal, tetapi masih banyak ruang untuk pembangunan. Lebih penting lagi, beberapa sarjana telah meneroka pembinaan model pemanduan autonomi melalui kaedah yang serupa dengan GPT, yang secara langsung mengeluarkan trajektori berdasarkan model bahasa berskala besar dan kemudian melaksanakannya melalui arahan kawalan telah diringkaskan dalam jadual berikut.

Semakan! Ringkaskan secara menyeluruh peranan penting model asas dalam mempromosikan pemanduan autonomi

Gunakan rangkaian tulang belakang terlatih untuk pemanduan autonomi hujung ke hujung

Idea teras kandungan berkaitan di atas adalah untuk meningkatkan kebolehtafsiran keputusan pemanduan autonomi, meningkatkan pemahaman dan analisis adegan, dan membimbing perancangan atau kawalan sistem pemanduan autonomi . Sepanjang tempoh masa lalu, terdapat banyak usaha untuk mengoptimumkan rangkaian tulang belakang model pra-latihan dalam pelbagai cara, dan mencapai hasil yang sangat baik. Oleh itu, untuk meringkaskan aplikasi model asas dengan lebih menyeluruh dalam pemanduan autonomi, kami merumuskan dan menyemak rangkaian tulang belakang yang telah dilatih dan penyelidikan yang telah mencapai keputusan yang sangat baik. Rajah di bawah menunjukkan keseluruhan proses pemanduan autonomi hujung ke hujung.

Semakan! Ringkaskan secara menyeluruh peranan penting model asas dalam mempromosikan pemanduan autonomi

Carta alir sistem pemanduan autonomi hujung ke hujung berdasarkan rangkaian tulang belakang yang telah terlatih

Dalam proses keseluruhan pemanduan autonomi hujung ke hujung, mengekstrak maklumat peringkat rendah daripada data mentah menentukan potensi prestasi model seterusnya pada tahap tertentu Tulang belakang pralatihan yang cemerlang boleh menjadikan model mempunyai keupayaan pembelajaran ciri yang lebih kukuh. Rangkaian konvolusi terlatih seperti ResNet dan VGG ialah rangkaian tulang belakang yang paling banyak digunakan untuk pengekstrakan ciri visual model hujung ke hujung. Rangkaian pra-latihan ini biasanya dilatih menggunakan pengesanan objek atau pembahagian sebagai tugas mengekstrak ciri umum, dan prestasi yang dicapai telah disahkan dalam banyak kerja.

Selain itu, model pemanduan autonomi hujung ke hujung awal terutamanya berdasarkan pelbagai jenis rangkaian saraf konvolusi dan diselesaikan melalui pembelajaran tiruan atau pembelajaran pengukuhan. Beberapa kerja baru-baru ini telah cuba membina sistem pemanduan autonomi hujung ke hujung dengan struktur rangkaian Transformer, dan juga telah mencapai hasil yang agak baik, seperti Transfuser, FusionAD, UniAD dan kerja lain.

Peningkatan Data

Dengan perkembangan lanjut teknologi pembelajaran mendalam dan penambahbaikan dan peningkatan lanjut seni bina rangkaian asas, model asas dengan pra-latihan dan penalaan halus telah menunjukkan prestasi yang semakin berkuasa. Model asas yang diwakili oleh GPT telah membolehkan transformasi model besar daripada peraturan paradigma pembelajaran kepada pendekatan dipacu data. Kepentingan data sebagai pautan utama dalam pembelajaran model tidak boleh diganti. Semasa latihan dan ujian model pemanduan autonomi, sejumlah besar data pemandangan digunakan untuk membolehkan model mempunyai pemahaman yang baik dan keupayaan membuat keputusan untuk pelbagai senario jalan raya dan trafik. Masalah ekor panjang yang dihadapi oleh pemanduan autonomi juga adalah hakikat bahawa terdapat senario tepi yang tidak berkesudahan yang tidak diketahui, yang menjadikan keupayaan generalisasi model seolah-olah tidak pernah mencukupi, mengakibatkan prestasi yang buruk.

Pembesaran data adalah penting untuk meningkatkan keupayaan generalisasi model pemanduan autonomi. Pelaksanaan penambahan data perlu mengambil kira dua aspek

Di satu pihak: cara mendapatkan data berskala besar supaya data yang diberikan kepada model pemanduan autonomi cukup pelbagai dan meluas
Sebaliknya: cara mendapatkan seberapa banyak data yang mungkin Data berkualiti tinggi, digunakan untuk melatih dan menguji model pemanduan autonomi, adalah tepat dan boleh dipercayai

Oleh itu, kerja penyelidikan berkaitan terutamanya menjalankan penyelidikan teknikal yang berkaitan dari dua aspek di atas Satu ialah memperkayakan kandungan data dalam set data sedia ada dan mempertingkatkan ciri Data dalam senario pemanduan. Yang kedua ialah menjana senario pemanduan pelbagai peringkat melalui simulasi.

Melanjutkan set data pemanduan autonomi

Set data pemanduan autonomi sedia ada diperoleh terutamanya dengan merakam data penderia dan kemudian melabelkan data. Ciri data yang diperoleh dengan cara ini biasanya tahap sangat rendah, dan magnitud set data juga agak lemah, yang sama sekali tidak mencukupi untuk ruang ciri visual senario pemanduan autonomi. Keupayaan pemahaman semantik, penaakulan dan tafsiran lanjutan bagi model asas yang diwakili oleh model bahasa memberikan idea baharu dan pendekatan teknikal untuk pengayaan dan pengembangan set data pemanduan autonomi. Memperluas set data dengan memanfaatkan keupayaan pemahaman, penaakulan dan tafsiran lanjutan bagi model asas boleh membantu menilai kebolehjelasan dan kawalan sistem pemanduan autonomi dengan lebih baik, dengan itu meningkatkan keselamatan dan kebolehpercayaan sistem pemanduan autonomi.

Jana adegan pemanduan

Adegan pemanduan sangat penting untuk pemanduan autonomi. Untuk mendapatkan data pemandangan pemanduan yang berbeza, hanya bergantung pada penderia kenderaan untuk pengumpulan masa nyata memerlukan kos yang besar, dan sukar untuk mendapatkan data pemandangan yang mencukupi untuk beberapa adegan tepi. Menjana adegan pemanduan yang realistik melalui simulasi telah menarik perhatian ramai penyelidik penyelidikan simulasi trafik terbahagi terutamanya kepada dua kategori: berasaskan peraturan dan dipacu data.

Pendekatan berasaskan peraturan: Gunakan peraturan yang dipratentukan, yang selalunya tidak mencukupi untuk menerangkan senario pemanduan yang kompleks, dan senario pemanduan simulasi adalah lebih mudah dan lebih umum
Pendekatan dipacu data: Gunakan data pemanduan untuk melatih model, Model ini boleh terus belajar dan menyesuaikan diri daripadanya. Walau bagaimanapun, kaedah berasaskan data biasanya memerlukan sejumlah besar data berlabel untuk latihan, yang menghalang perkembangan selanjutnya simulasi trafik Dengan perkembangan teknologi, kaedah penjanaan data semasa telah berubah secara beransur-ansur daripada kaedah berasaskan peraturan kepada data-. kaedah didorong. Dengan mensimulasikan senario pemanduan dengan cekap dan tepat, termasuk pelbagai situasi yang kompleks dan berbahaya, sejumlah besar data latihan disediakan untuk pembelajaran model, yang boleh meningkatkan keupayaan generalisasi sistem pemanduan autonomi dengan berkesan. Pada masa yang sama, senario pemanduan yang dijana juga boleh digunakan untuk menilai sistem dan algoritma pemanduan autonomi yang berbeza untuk menguji dan mengesahkan prestasi sistem. Jadual di bawah ialah ringkasan strategi penambahan data yang berbeza.

Ringkasan strategi penambahan data yang berbeza Semakan! Ringkaskan secara menyeluruh peranan penting model asas dalam mempromosikan pemanduan autonomi

Model Dunia

Model dunia dianggap sebagai model kecerdasan buatan yang mengandungi pemahaman atau perwakilan keseluruhan persekitaran di mana ia beroperasi. Model ini mampu mensimulasikan persekitaran untuk membuat ramalan atau keputusan. Dalam literatur terkini, istilah "model dunia" disebut dalam konteks pembelajaran pengukuhan. Konsep ini juga semakin mendapat tarikan dalam aplikasi pemanduan autonomi kerana keupayaannya untuk memahami dan menjelaskan dinamik persekitaran pemanduan. Model dunia sangat berkaitan dengan pembelajaran pengukuhan, pembelajaran tiruan, dan model generatif mendalam. Walau bagaimanapun, menggunakan model dunia dalam pembelajaran pengukuhan dan pembelajaran tiruan biasanya memerlukan data yang dilabel dengan baik, dan kaedah seperti SEM2 dan MILE dilakukan dalam paradigma yang diselia. Pada masa yang sama, terdapat juga percubaan untuk menggabungkan pembelajaran pengukuhan dan pembelajaran tanpa pengawasan berdasarkan batasan data berlabel. Disebabkan hubungan rapat mereka dengan pembelajaran penyeliaan sendiri, model generatif mendalam telah menjadi semakin popular dan banyak kerja telah dicadangkan. Rajah di bawah menunjukkan carta aliran keseluruhan menggunakan model dunia untuk meningkatkan model pemanduan autonomi.

Semakan! Ringkaskan secara menyeluruh peranan penting model asas dalam mempromosikan pemanduan autonomi

Carta aliran keseluruhan untuk peningkatan model pemanduan autonomi model dunia

Model generatif dalam

Model generatif dalam biasanya termasuk pengekod auto variasi, rangkaian lawan generatif, model aliran autore, dan.

Pengekod auto variasi menggabungkan idea pengekod auto dan model grafik kebarangkalian untuk mempelajari struktur asas data dan menjana sampel baharu
Rangkaian musuh generatif terdiri daripada dua rangkaian saraf, penjana dan diskriminator, yang menggunakan latihan lawan dan penambahbaikan. satu sama lain, dan akhirnya mencapai matlamat untuk menjana sampel sebenar
Model aliran menukar pengedaran terdahulu yang mudah kepada pengedaran posterior yang kompleks melalui satu siri transformasi boleh balik untuk menjana sampel data yang serupa
Model autoregresif ialah sejenis jujukan Analisis kaedah, berdasarkan autokorelasi antara data jujukan, menerangkan hubungan antara pemerhatian semasa dan pemerhatian lepas Anggaran parameter model biasanya dilakukan menggunakan kaedah kuasa dua terkecil dan anggaran kemungkinan maksimum. Model resapan ialah model autoregresif biasa yang mempelajari proses penyahnosian secara berperingkat daripada data hingar tulen. Disebabkan prestasi generatifnya yang berkuasa, model resapan ialah model SOTA baharu di kalangan model generatif dalam semasa

Kaedah generatif

Berdasarkan keupayaan berkuasa model generatif dalam, model generatif dalam digunakan sebagai model dunia untuk belajar memandu senario untuk mempertingkatkan Pemanduan automatik secara beransur-ansur menjadi tumpuan penyelidikan. Seterusnya kita mengkaji penggunaan model generatif dalam sebagai model dunia dalam pemanduan autonomi. Penglihatan adalah salah satu cara paling langsung dan berkesan untuk manusia mendapatkan maklumat tentang dunia, kerana data imej mengandungi maklumat ciri yang sangat kaya. Banyak karya terdahulu telah menyelesaikan tugas penjanaan imej melalui model dunia, menunjukkan bahawa model dunia mempunyai keupayaan pemahaman dan penaakulan yang baik untuk data imej. Secara keseluruhannya, penyelidik berharap untuk mempelajari undang-undang evolusi yang wujud di dunia daripada data imej dan kemudian meramalkan keadaan masa depan. Digabungkan dengan pembelajaran penyeliaan sendiri, model dunia digunakan untuk belajar daripada data imej, melepaskan sepenuhnya keupayaan penaakulan model dan menyediakan arah yang boleh dilaksanakan untuk membina model asas umum dalam domain visual. Rajah di bawah menunjukkan ringkasan beberapa kerja berkaitan menggunakan model dunia. Ringkasan kerja menggunakan model dunia untuk ramalan . Ini ialah seni bina bukan generatif dan diselia sendiri kerana ia tidak meramalkan output secara langsung berdasarkan data input, tetapi mengekod data input dalam ruang abstrak untuk melengkapkan ramalan akhir. Kelebihan kaedah ramalan ini ialah ia tidak memerlukan meramalkan semua maklumat tentang output dan boleh menghapuskan butiran yang tidak berkaitan.

JEPA ialah seni bina pembelajaran yang diselia sendiri berdasarkan model tenaga, yang memerhati dan mempelajari cara dunia berfungsi dan undang-undang yang sangat umum. JEPA juga mempunyai potensi besar dalam pemanduan autonomi dan dijangka menjana senario pemanduan berkualiti tinggi dan strategi pemanduan dengan mempelajari cara pemanduan berfungsi. Semakan! Ringkaskan secara menyeluruh peranan penting model asas dalam mempromosikan pemanduan autonomi

Kesimpulan

Artikel ini memberikan gambaran menyeluruh tentang peranan penting model asas dalam aplikasi pemanduan autonomi. Berdasarkan ringkasan dan penemuan kerja penyelidikan berkaitan yang ditinjau dalam artikel ini, hala tuju lain yang patut diterokai selanjutnya ialah cara mereka bentuk seni bina rangkaian yang berkesan untuk pembelajaran penyeliaan kendiri. Pembelajaran penyeliaan kendiri secara berkesan boleh menembusi batasan anotasi data, membolehkan model mempelajari data secara besar-besaran dan melepaskan sepenuhnya keupayaan penaakulan model. Jika model asas pemanduan autonomi boleh dilatih menggunakan skala data pemandangan pemanduan yang berbeza di bawah paradigma pembelajaran yang diselia sendiri, keupayaan generalisasinya dijangka akan dipertingkatkan dengan banyak. Kemajuan sedemikian mungkin membolehkan model asas yang lebih umum.

Ringkasnya, walaupun terdapat banyak cabaran dalam menggunakan model asas kepada pemanduan autonomi, ia mempunyai ruang aplikasi yang sangat luas dan prospek pembangunan. Pada masa hadapan, kami akan terus memerhatikan kemajuan model asas yang digunakan untuk pemanduan autonomi.

Atas ialah kandungan terperinci Semakan! Ringkaskan secara menyeluruh peranan penting model asas dalam mempromosikan pemanduan autonomi. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Tunjukkan Lagi

Artikel Panas

Bagaimana untuk memperbaiki KB5055612 gagal dipasang di Windows 10?

4 minggu yang lalu By DDD

<🎜>: Bubble Gum Simulator Infinity - Cara Mendapatkan dan Menggunakan Kekunci Diraja

4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

<🎜>: Tumbuh Taman - Panduan Mutasi Lengkap

3 minggu yang lalu By DDD

Nordhold: Sistem Fusion, dijelaskan

4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Mandragora: Whispers of the Witch Tree - Cara Membuka Kunci Cangkuk Bergelut

3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Tunjukkan Lagi

Alat panas

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Tunjukkan Lagi

Topik panas

Tutorial Java

1673

Tutorial CakePHP

1428

Tutorial Laravel

1333

Tutorial PHP

1278

Tutorial C#

1257

Tunjukkan Lagi

Related knowledge

Bagaimana untuk menyelesaikan masalah ekor panjang dalam senario pemanduan autonomi? Jun 02, 2024 pm 02:44 PM

Semalam semasa temu bual, saya telah ditanya sama ada saya telah membuat sebarang soalan berkaitan ekor panjang, jadi saya fikir saya akan memberikan ringkasan ringkas. Masalah ekor panjang pemanduan autonomi merujuk kepada kes tepi dalam kenderaan autonomi, iaitu, kemungkinan senario dengan kebarangkalian yang rendah untuk berlaku. Masalah ekor panjang yang dirasakan adalah salah satu sebab utama yang kini mengehadkan domain reka bentuk pengendalian kenderaan autonomi pintar satu kenderaan. Seni bina asas dan kebanyakan isu teknikal pemanduan autonomi telah diselesaikan, dan baki 5% masalah ekor panjang secara beransur-ansur menjadi kunci untuk menyekat pembangunan pemanduan autonomi. Masalah ini termasuk pelbagai senario yang berpecah-belah, situasi yang melampau dan tingkah laku manusia yang tidak dapat diramalkan. "Ekor panjang" senario tepi dalam pemanduan autonomi merujuk kepada kes tepi dalam kenderaan autonomi (AVs) kes Edge adalah senario yang mungkin dengan kebarangkalian yang rendah untuk berlaku. kejadian yang jarang berlaku ini

Model MoE sumber terbuka paling berkuasa di dunia ada di sini, dengan keupayaan bahasa Cina setanding dengan GPT-4, dan harganya hanya hampir satu peratus daripada GPT-4-Turbo May 07, 2024 pm 04:13 PM

Bayangkan model kecerdasan buatan yang bukan sahaja mempunyai keupayaan untuk mengatasi pengkomputeran tradisional, tetapi juga mencapai prestasi yang lebih cekap pada kos yang lebih rendah. Ini bukan fiksyen sains, DeepSeek-V2[1], model MoE sumber terbuka paling berkuasa di dunia ada di sini. DeepSeek-V2 ialah gabungan model bahasa pakar (MoE) yang berkuasa dengan ciri-ciri latihan ekonomi dan inferens yang cekap. Ia terdiri daripada 236B parameter, 21B daripadanya digunakan untuk mengaktifkan setiap penanda. Berbanding dengan DeepSeek67B, DeepSeek-V2 mempunyai prestasi yang lebih kukuh, sambil menjimatkan 42.5% kos latihan, mengurangkan cache KV sebanyak 93.3% dan meningkatkan daya pemprosesan penjanaan maksimum kepada 5.76 kali. DeepSeek ialah sebuah syarikat yang meneroka kecerdasan buatan am

Apr 09, 2024 am 11:52 AM

AI memang mengubah matematik. Baru-baru ini, Tao Zhexuan, yang telah mengambil perhatian terhadap isu ini, telah memajukan keluaran terbaru "Buletin Persatuan Matematik Amerika" (Buletin Persatuan Matematik Amerika). Memfokuskan pada topik "Adakah mesin akan mengubah matematik?", ramai ahli matematik menyatakan pendapat mereka Seluruh proses itu penuh dengan percikan api, tegar dan menarik. Penulis mempunyai barisan yang kuat, termasuk pemenang Fields Medal Akshay Venkatesh, ahli matematik China Zheng Lejun, saintis komputer NYU Ernest Davis dan ramai lagi sarjana terkenal dalam industri. Dunia AI telah berubah secara mendadak Anda tahu, banyak artikel ini telah dihantar setahun yang lalu.

KAN, yang menggantikan MLP, telah diperluaskan kepada konvolusi oleh projek sumber terbuka Jun 01, 2024 pm 10:03 PM

Awal bulan ini, penyelidik dari MIT dan institusi lain mencadangkan alternatif yang sangat menjanjikan kepada MLP - KAN. KAN mengatasi MLP dari segi ketepatan dan kebolehtafsiran. Dan ia boleh mengatasi prestasi MLP berjalan dengan bilangan parameter yang lebih besar dengan bilangan parameter yang sangat kecil. Sebagai contoh, penulis menyatakan bahawa mereka menggunakan KAN untuk menghasilkan semula keputusan DeepMind dengan rangkaian yang lebih kecil dan tahap automasi yang lebih tinggi. Khususnya, MLP DeepMind mempunyai kira-kira 300,000 parameter, manakala KAN hanya mempunyai kira-kira 200 parameter. KAN mempunyai asas matematik yang kukuh seperti MLP berdasarkan teorem penghampiran universal, manakala KAN berdasarkan teorem perwakilan Kolmogorov-Arnold. Seperti yang ditunjukkan dalam rajah di bawah, KAN telah

Hello, Atlas elektrik! Robot Boston Dynamics hidup semula, gerakan pelik 180 darjah menakutkan Musk Apr 18, 2024 pm 07:58 PM

Boston Dynamics Atlas secara rasmi memasuki era robot elektrik! Semalam, Atlas hidraulik hanya "menangis" menarik diri daripada peringkat sejarah Hari ini, Boston Dynamics mengumumkan bahawa Atlas elektrik sedang berfungsi. Nampaknya dalam bidang robot humanoid komersial, Boston Dynamics berazam untuk bersaing dengan Tesla. Selepas video baharu itu dikeluarkan, ia telah pun ditonton oleh lebih sejuta orang dalam masa sepuluh jam sahaja. Orang lama pergi dan peranan baru muncul. Ini adalah keperluan sejarah. Tidak dinafikan bahawa tahun ini adalah tahun letupan robot humanoid. Netizen mengulas: Kemajuan robot telah menjadikan majlis pembukaan tahun ini kelihatan seperti manusia, dan tahap kebebasan adalah jauh lebih besar daripada manusia Tetapi adakah ini benar-benar bukan filem seram? Pada permulaan video, Atlas berbaring dengan tenang di atas tanah, seolah-olah terlentang. Apa yang berikut adalah rahang-jatuh

Robot Tesla bekerja di kilang, Musk: Tahap kebebasan tangan akan mencapai 22 tahun ini! May 06, 2024 pm 04:13 PM

Video terbaru robot Tesla Optimus dikeluarkan, dan ia sudah boleh berfungsi di kilang. Pada kelajuan biasa, ia mengisih bateri (bateri 4680 Tesla) seperti ini: Pegawai itu juga mengeluarkan rupanya pada kelajuan 20x - pada "stesen kerja" kecil, memilih dan memilih dan memilih: Kali ini ia dikeluarkan Salah satu sorotan video itu ialah Optimus menyelesaikan kerja ini di kilang, sepenuhnya secara autonomi, tanpa campur tangan manusia sepanjang proses. Dan dari perspektif Optimus, ia juga boleh mengambil dan meletakkan bateri yang bengkok, memfokuskan pada pembetulan ralat automatik: Berkenaan tangan Optimus, saintis NVIDIA Jim Fan memberikan penilaian yang tinggi: Tangan Optimus adalah robot lima jari di dunia paling cerdik. Tangannya bukan sahaja boleh disentuh

$Yang terbaru dari Universiti Oxford! Mickey: Padanan imej 2D dalam SOTA 3D! (CVPR\'24)$ Yang terbaru dari Universiti Oxford! Mickey: Padanan imej 2D dalam SOTA 3D! (CVPR\'24) Apr 23, 2024 pm 01:20 PM

Pautan projek ditulis di hadapan: https://nianticlabs.github.io/mickey/ Memandangkan dua gambar, pose kamera di antara mereka boleh dianggarkan dengan mewujudkan kesesuaian antara gambar. Biasanya, surat-menyurat ini adalah 2D hingga 2D, dan anggaran pose kami adalah skala-tak tentu. Sesetengah aplikasi, seperti realiti tambahan segera pada bila-bila masa, di mana-mana sahaja, memerlukan anggaran pose metrik skala, jadi mereka bergantung pada penganggar kedalaman luaran untuk memulihkan skala. Makalah ini mencadangkan MicKey, proses pemadanan titik utama yang mampu meramalkan korespondensi metrik dalam ruang kamera 3D. Dengan mempelajari padanan koordinat 3D merentas imej, kami dapat membuat kesimpulan relatif metrik

FisheyeDetNet: algoritma pengesanan sasaran pertama berdasarkan kamera fisheye Apr 26, 2024 am 11:37 AM

Pengesanan objek ialah masalah yang agak matang dalam sistem pemanduan autonomi, antaranya pengesanan pejalan kaki adalah salah satu algoritma terawal untuk digunakan. Penyelidikan yang sangat komprehensif telah dijalankan dalam kebanyakan kertas kerja. Walau bagaimanapun, persepsi jarak menggunakan kamera fisheye untuk pandangan sekeliling agak kurang dikaji. Disebabkan herotan jejari yang besar, perwakilan kotak sempadan standard sukar dilaksanakan dalam kamera fisheye. Untuk mengurangkan perihalan di atas, kami meneroka kotak sempadan lanjutan, elips dan reka bentuk poligon am ke dalam perwakilan kutub/sudut dan mentakrifkan metrik mIOU pembahagian contoh untuk menganalisis perwakilan ini. Model fisheyeDetNet yang dicadangkan dengan bentuk poligon mengatasi model lain dan pada masa yang sama mencapai 49.5% mAP pada set data kamera fisheye Valeo untuk pemanduan autonomi

See all articles