Jadual Kandungan
​Gambaran keseluruhan model LM-Nav
Hasil eksperimen
Penilaian kualitatif
Penilaian Kuantitatif
Rumah Peranti teknologi AI Kerja baharu guru pembelajaran pengukuhan Sergey Levine: Tiga model besar mengajar robot mengenali cara mereka

Kerja baharu guru pembelajaran pengukuhan Sergey Levine: Tiga model besar mengajar robot mengenali cara mereka

Apr 12, 2023 pm 11:55 PM
robot pembelajaran mesin Model terlatih

Robot dengan model terbina dalam yang besar telah belajar mengikuti arahan bahasa untuk mencapai tujuannya tanpa melihat peta ini datang dari kerja baru penguatkuasaan pembelajaran Sergey Levine.

Memandangkan destinasi, betapa sukarnya untuk mencapainya dengan lancar tanpa trek navigasi?

Kerja baharu guru pembelajaran pengukuhan Sergey Levine: Tiga model besar mengajar robot mengenali cara mereka

Tugas ini juga sangat mencabar bagi manusia yang tidak mempunyai hala tuju. Tetapi dalam kajian baru-baru ini, beberapa ahli akademik "mengajar" robot menggunakan hanya tiga model pra-latihan.

Kita semua tahu bahawa salah satu cabaran teras pembelajaran robot adalah untuk membolehkan robot melaksanakan pelbagai tugas mengikut arahan manusia peringkat tinggi. Ini memerlukan robot yang boleh memahami arahan manusia dan dilengkapi dengan sejumlah besar tindakan berbeza untuk melaksanakan arahan ini di dunia nyata.

Untuk arahan mengikut tugasan dalam navigasi, kerja sebelumnya tertumpu terutamanya pada pembelajaran daripada trajektori yang dianotasi dengan arahan teks. Ini mungkin membolehkan pemahaman arahan teks, tetapi kos anotasi data telah menghalang penggunaan meluas teknik ini. Sebaliknya, kerja baru-baru ini telah menunjukkan bahawa latihan penyeliaan sendiri bagi dasar bermatlamat boleh mempelajari navigasi yang mantap. Kaedah ini adalah berdasarkan set data yang besar dan tidak berlabel, dengan pelabelan semula post hoc untuk melatih pengawal berasaskan penglihatan. Kaedah ini boleh berskala, umum dan teguh, tetapi selalunya memerlukan penggunaan mekanisme spesifikasi sasaran berasaskan lokasi atau imej yang menyusahkan.

Dalam kertas kerja terbaharu, penyelidik dari UC Berkeley, Google dan institusi lain menyasarkan untuk menggabungkan kelebihan kedua-dua kaedah ini untuk menjadikan sistem penyeliaan sendiri untuk navigasi robot terpakai pada data navigasi tanpa sebarang anotasi pengguna , memanfaatkan keupayaan model pra-latihan untuk melaksanakan arahan bahasa semula jadi. Penyelidik menggunakan model ini untuk membina "antara muka" yang menyampaikan tugas kepada robot. Sistem ini memanfaatkan keupayaan generalisasi bahasa pra-latihan dan model bahasa penglihatan untuk membolehkan sistem robotik menerima arahan peringkat tinggi yang kompleks.

Kerja baharu guru pembelajaran pengukuhan Sergey Levine: Tiga model besar mengajar robot mengenali cara mereka

  • Pautan kertas: https://arxiv.org/pdf/2207.04429.pdf
  • Pautan kod: https://github.com/blazejosinski/lm_nav

Para penyelidik memerhatikan bahawa adalah mungkin untuk memanfaatkan model pra-latihan di luar rak yang dilatih pada korpora visual yang besar dan set data bahasa ( Korpora ini tersedia secara meluas dan menunjukkan keupayaan generalisasi sifar pukulan) untuk mencipta antara muka yang membolehkan penjejakan arahan khusus. Untuk mencapai matlamat ini, para penyelidik menggabungkan kelebihan model pra-latihan agnostik robot penglihatan dan bahasa serta model navigasi pra-terlatih. Secara khusus, mereka menggunakan model navigasi visual (VNM:ViNG) untuk mencipta output visual robot ke dalam "peta mental" topologi persekitaran. Memandangkan arahan teks bentuk bebas, model bahasa besar yang telah dilatih (LLM: GPT-3) digunakan untuk menyahkod arahan ke dalam satu siri titik ciri bentuk teks. Kemudian, model bahasa visual (VLM: CLIP) digunakan untuk mewujudkan titik ciri teks ini dalam peta topologi dengan membuat kesimpulan kemungkinan bersama titik ciri dan nod. Algoritma carian baharu kemudiannya digunakan untuk memaksimumkan fungsi objektif kebarangkalian dan mencari laluan arahan robot, yang kemudiannya dilaksanakan oleh VNM. Sumbangan utama penyelidikan adalah kaedah navigasi di bawah model berskala besar (LM Nav), sistem penjejakan arahan khusus. Ia menggabungkan tiga model pra-latihan bebas yang besar - model kawalan robot yang diselia sendiri yang memanfaatkan pemerhatian visual dan tindakan fizikal (VNM), model bahasa visual yang meletakkan imej dalam teks tetapi tanpa persekitaran pelaksanaan konkrit (VLM), dan besar. model bahasa yang menghuraikan dan menterjemah teks tetapi tidak mempunyai asas visual atau deria terkandung (LLM) untuk membolehkan penjejakan arahan pandangan panjang dalam persekitaran dunia sebenar yang kompleks. Buat pertama kalinya, penyelidik mencetuskan idea untuk menggabungkan model penglihatan dan bahasa yang telah dilatih dengan pengawal bersyarat sasaran untuk memperoleh laluan arahan yang boleh diambil tindakan dalam persekitaran sasaran tanpa sebarang penalaan halus. Terutama sekali, ketiga-tiga model dilatih pada set data berskala besar, mempunyai fungsi objektif yang diselia sendiri dan digunakan di luar kotak tanpa penalaan halus - latihan LM Nav tidak memerlukan anotasi manusia bagi data navigasi robot.

​ Eksperimen menunjukkan bahawa LM Nav berjaya mengikut arahan bahasa semula jadi dalam persekitaran baharu sambil menggunakan perintah berbutir halus untuk menghilangkan kekaburan laluan semasa navigasi pinggir bandar yang kompleks sejauh 100 meter.

Kerja baharu guru pembelajaran pengukuhan Sergey Levine: Tiga model besar mengajar robot mengenali cara mereka

​Gambaran keseluruhan model LM-Nav

Jadi, bagaimanakah penyelidik menggunakan imej dan model bahasa yang telah dilatih untuk menyediakan antara muka teks untuk model navigasi visual?

Kerja baharu guru pembelajaran pengukuhan Sergey Levine: Tiga model besar mengajar robot mengenali cara mereka

​1. Memandangkan satu set pemerhatian dalam persekitaran sasaran, menggunakan fungsi jarak bersyarat sasaran, iaitu model navigasi visual (VNM) bahagian, membuat kesimpulan keterkaitan antara mereka, dan membina peta topologi ketersambungan dalam persekitaran.

Kerja baharu guru pembelajaran pengukuhan Sergey Levine: Tiga model besar mengajar robot mengenali cara mereka

​2. Model bahasa besar (LLM) digunakan untuk menghuraikan arahan bahasa semula jadi kepada satu siri titik ciri, titik Ciri ini boleh berfungsi sebagai submatlamat perantaraan untuk navigasi.

Kerja baharu guru pembelajaran pengukuhan Sergey Levine: Tiga model besar mengajar robot mengenali cara mereka

3. Model Visual-Bahasa (VLM) digunakan untuk membina pemerhatian visual berdasarkan frasa titik ciri. Model bahasa visual membuat kesimpulan taburan kebarangkalian bersama ke atas perihalan dan imej titik ciri (membentuk nod dalam graf di atas).

Kerja baharu guru pembelajaran pengukuhan Sergey Levine: Tiga model besar mengajar robot mengenali cara mereka

​4 Menggunakan taburan kebarangkalian VLM dan kesambungan graf yang disimpulkan oleh VNM, menggunakan algoritma carian baru , mendapatkan semula laluan arahan optimum dalam persekitaran, yang (i) memenuhi arahan asal dan (ii) ialah laluan terpendek dalam graf yang boleh mencapai matlamat.

Kerja baharu guru pembelajaran pengukuhan Sergey Levine: Tiga model besar mengajar robot mengenali cara mereka

5. Kemudian, laluan arahan dilaksanakan oleh dasar keadaan sasaran, yang merupakan sebahagian daripada VNM. ​

Kerja baharu guru pembelajaran pengukuhan Sergey Levine: Tiga model besar mengajar robot mengenali cara mereka

Hasil eksperimen

Penilaian kualitatif

Rajah 4 menunjukkan beberapa contoh laluan yang diambil oleh robot . (Perhatikan bahawa robot tidak boleh mendapatkan imej di atas kepala dan kedudukan spatial titik ciri, dan apa yang dipaparkan hanyalah kesan visual).

Kerja baharu guru pembelajaran pengukuhan Sergey Levine: Tiga model besar mengajar robot mengenali cara mereka

​Dalam Rajah 4(a), LM-Nav berjaya mengesan titik ciri mudah daripada laluan sebelumnya dan mencari laluan menuju ke laluan pendek. Walaupun terdapat berbilang titik ciri tempat letak kereta dalam persekitaran, fungsi objektif dalam Persamaan 3 membolehkan robot memilih titik ciri tempat letak kereta yang betul dalam konteks, dengan itu meminimumkan jarak perjalanan keseluruhan.

Rajah 4(b) menyerlahkan keupayaan LM-Nav untuk menghuraikan laluan tertentu dengan berbilang titik ciri—walaupun sampai terus ke titik ciri terakhir ialah laluan terpendek apabila mengabaikan laluan arahan, robot masih laluan A yang melawati semua titik ciri dalam susunan yang betul boleh didapati.

​Gunakan arahan untuk nyahkekaburan. Memandangkan matlamat LM Nav adalah untuk mengikut arahan, bukan sekadar mencapai matlamat akhir, arahan yang berbeza mungkin menghasilkan laluan yang berbeza. Rajah 5 menunjukkan contoh yang mengubah suai arahan boleh menyahkekaburan berbilang laluan ke matlamat. Untuk gesaan yang lebih pendek (biru), LM Nav lebih suka laluan yang lebih terus. Apabila menentukan laluan yang lebih halus (magenta), LM Nav mengambil laluan alternatif melalui set titik ciri yang berbeza.

Kerja baharu guru pembelajaran pengukuhan Sergey Levine: Tiga model besar mengajar robot mengenali cara mereka

​Situasi di mana titik ciri tiada. Walaupun LM-Nav boleh menghuraikan titik ciri secara berkesan dalam arahan, mencarinya pada graf dan mencari laluan ke matlamat, proses ini bergantung pada andaian bahawa titik ciri (i) wujud dalam persekitaran sebenar, dan (ii) boleh diiktiraf oleh VLM. Rajah 4(c) menunjukkan situasi di mana laluan boleh laku gagal melawat salah satu titik ciri—pili api—dan mengambil laluan di sekitar bahagian atas bangunan dan bukannya bahagian bawah. Kes kegagalan ini disebabkan oleh ketidakupayaan VLM untuk mengesan pili bomba daripada pemerhatian robot.

Dalam menilai secara bebas keberkesanan VLM dalam mendapatkan titik ciri, para penyelidik mendapati bahawa walaupun ia adalah model luar biasa terbaik untuk jenis tugasan ini, CLIP tidak dapat mendapatkan sebilangan kecil titik ciri "keras" , termasuk pili bomba dan pembancuh simen. Tetapi dalam banyak situasi dunia sebenar, robot masih boleh berjaya mencari jalan untuk melawati titik ciri yang tinggal.

Penilaian Kuantitatif

Jadual 1 meringkaskan prestasi kuantitatif sistem dalam 20 arahan. Dalam 85% eksperimen, LM-Nav dapat mengikut arahan secara konsisten tanpa perlanggaran atau detasmen (purata satu campur tangan setiap 6.4 kilometer perjalanan). Berbanding dengan garis dasar tanpa model navigasi, LM-Nav secara konsisten menunjukkan prestasi yang lebih baik dalam melaksanakan laluan sasaran yang cekap dan bebas perlanggaran. Dalam semua percubaan yang tidak berjaya, kegagalan boleh dikaitkan dengan keupayaan yang tidak mencukupi dalam fasa perancangan—ketidakupayaan algoritma carian untuk mengesan titik ciri "keras" tertentu secara intuitif dalam graf—mengakibatkan pelaksanaan arahan yang tidak lengkap. Siasatan ke atas mod kegagalan ini mendedahkan bahawa bahagian sistem yang paling kritikal ialah keupayaan VLM untuk mengesan titik ciri yang tidak dikenali, seperti pili bomba, dan pemandangan di bawah keadaan pencahayaan yang mencabar, seperti imej yang kurang terdedah.

Kerja baharu guru pembelajaran pengukuhan Sergey Levine: Tiga model besar mengajar robot mengenali cara mereka

Atas ialah kandungan terperinci Kerja baharu guru pembelajaran pengukuhan Sergey Levine: Tiga model besar mengajar robot mengenali cara mereka. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)
1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Tetapan grafik terbaik
1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌
Akan R.E.P.O. Ada Crossplay?
1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Artikel ini akan membawa anda memahami SHAP: penjelasan model untuk pembelajaran mesin Artikel ini akan membawa anda memahami SHAP: penjelasan model untuk pembelajaran mesin Jun 01, 2024 am 10:58 AM

Dalam bidang pembelajaran mesin dan sains data, kebolehtafsiran model sentiasa menjadi tumpuan penyelidik dan pengamal. Dengan aplikasi meluas model yang kompleks seperti kaedah pembelajaran mendalam dan ensemble, memahami proses membuat keputusan model menjadi sangat penting. AI|XAI yang boleh dijelaskan membantu membina kepercayaan dan keyakinan dalam model pembelajaran mesin dengan meningkatkan ketelusan model. Meningkatkan ketelusan model boleh dicapai melalui kaedah seperti penggunaan meluas pelbagai model yang kompleks, serta proses membuat keputusan yang digunakan untuk menerangkan model. Kaedah ini termasuk analisis kepentingan ciri, anggaran selang ramalan model, algoritma kebolehtafsiran tempatan, dsb. Analisis kepentingan ciri boleh menerangkan proses membuat keputusan model dengan menilai tahap pengaruh model ke atas ciri input. Anggaran selang ramalan model

Kenal pasti overfitting dan underfitting melalui lengkung pembelajaran Kenal pasti overfitting dan underfitting melalui lengkung pembelajaran Apr 29, 2024 pm 06:50 PM

Artikel ini akan memperkenalkan cara mengenal pasti pemasangan lampau dan kekurangan dalam model pembelajaran mesin secara berkesan melalui keluk pembelajaran. Underfitting dan overfitting 1. Overfitting Jika model terlampau latihan pada data sehingga ia mempelajari bunyi daripadanya, maka model tersebut dikatakan overfitting. Model yang dipasang terlebih dahulu mempelajari setiap contoh dengan sempurna sehingga ia akan salah mengklasifikasikan contoh yang tidak kelihatan/baharu. Untuk model terlampau, kami akan mendapat skor set latihan yang sempurna/hampir sempurna dan set pengesahan/skor ujian yang teruk. Diubah suai sedikit: "Punca overfitting: Gunakan model yang kompleks untuk menyelesaikan masalah mudah dan mengekstrak bunyi daripada data. Kerana set data kecil sebagai set latihan mungkin tidak mewakili perwakilan yang betul bagi semua data. 2. Underfitting Heru

Evolusi kecerdasan buatan dalam penerokaan angkasa lepas dan kejuruteraan penempatan manusia Evolusi kecerdasan buatan dalam penerokaan angkasa lepas dan kejuruteraan penempatan manusia Apr 29, 2024 pm 03:25 PM

Pada tahun 1950-an, kecerdasan buatan (AI) dilahirkan. Ketika itulah penyelidik mendapati bahawa mesin boleh melakukan tugas seperti manusia, seperti berfikir. Kemudian, pada tahun 1960-an, Jabatan Pertahanan A.S. membiayai kecerdasan buatan dan menubuhkan makmal untuk pembangunan selanjutnya. Penyelidik sedang mencari aplikasi untuk kecerdasan buatan dalam banyak bidang, seperti penerokaan angkasa lepas dan kelangsungan hidup dalam persekitaran yang melampau. Penerokaan angkasa lepas ialah kajian tentang alam semesta, yang meliputi seluruh alam semesta di luar bumi. Angkasa lepas diklasifikasikan sebagai persekitaran yang melampau kerana keadaannya berbeza daripada di Bumi. Untuk terus hidup di angkasa, banyak faktor mesti dipertimbangkan dan langkah berjaga-jaga mesti diambil. Para saintis dan penyelidik percaya bahawa meneroka ruang dan memahami keadaan semasa segala-galanya boleh membantu memahami cara alam semesta berfungsi dan bersedia untuk menghadapi kemungkinan krisis alam sekitar

Melaksanakan Algoritma Pembelajaran Mesin dalam C++: Cabaran dan Penyelesaian Biasa Melaksanakan Algoritma Pembelajaran Mesin dalam C++: Cabaran dan Penyelesaian Biasa Jun 03, 2024 pm 01:25 PM

Cabaran biasa yang dihadapi oleh algoritma pembelajaran mesin dalam C++ termasuk pengurusan memori, multi-threading, pengoptimuman prestasi dan kebolehselenggaraan. Penyelesaian termasuk menggunakan penunjuk pintar, perpustakaan benang moden, arahan SIMD dan perpustakaan pihak ketiga, serta mengikuti garis panduan gaya pengekodan dan menggunakan alat automasi. Kes praktikal menunjukkan cara menggunakan perpustakaan Eigen untuk melaksanakan algoritma regresi linear, mengurus memori dengan berkesan dan menggunakan operasi matriks berprestasi tinggi.

Bagaimanakah AI boleh menjadikan robot lebih autonomi dan boleh disesuaikan? Bagaimanakah AI boleh menjadikan robot lebih autonomi dan boleh disesuaikan? Jun 03, 2024 pm 07:18 PM

Dalam bidang teknologi automasi perindustrian, terdapat dua titik panas terkini yang sukar diabaikan: kecerdasan buatan (AI) dan Nvidia. Jangan ubah maksud kandungan asal, perhalusi kandungan, tulis semula kandungan, jangan teruskan: “Bukan itu sahaja, kedua-duanya berkait rapat, kerana Nvidia tidak terhad kepada unit pemprosesan grafik asalnya (GPU ), ia sedang mengembangkan GPUnya Teknologi ini meluas ke bidang kembar digital dan berkait rapat dengan teknologi AI yang baru muncul "Baru-baru ini, NVIDIA telah mencapai kerjasama dengan banyak syarikat industri, termasuk syarikat automasi industri terkemuka seperti Aveva, Rockwell Automation, Siemens. dan Schneider Electric, serta Teradyne Robotics dan syarikat MiR dan Universal Robotsnya. Baru-baru ini, Nvidiahascoll

Cloud Whale Xiaoyao 001 robot menyapu dan mengemop mempunyai 'otak'! | Cloud Whale Xiaoyao 001 robot menyapu dan mengemop mempunyai 'otak'! | Apr 26, 2024 pm 04:22 PM

Robot menyapu dan mengemop adalah salah satu perkakas rumah pintar yang paling popular di kalangan pengguna sejak beberapa tahun kebelakangan ini. Kemudahan operasi yang dibawanya, atau bahkan keperluan tanpa operasi, membolehkan orang yang malas membebaskan tangan mereka, membolehkan pengguna "membebaskan" daripada kerja rumah harian dan menghabiskan lebih banyak masa untuk perkara yang mereka sukai Peningkatan kualiti hidup dalam bentuk yang menyamar. Menunggang kegilaan ini, hampir semua jenama perkakas rumah di pasaran membuat robot menyapu dan mengemop mereka sendiri, menjadikan keseluruhan pasaran robot menyapu dan mengemop sangat meriah. Walau bagaimanapun, perkembangan pesat pasaran pasti akan membawa bahaya tersembunyi: banyak pengeluar akan menggunakan taktik laut mesin untuk menduduki lebih banyak bahagian pasaran dengan cepat, menyebabkan banyak produk baru tanpa sebarang titik peningkatan mereka adalah model "matryoshka" Tidak keterlaluan. Walau bagaimanapun, tidak semua robot menyapu dan mengemop

Lima sekolah pembelajaran mesin yang anda tidak tahu Lima sekolah pembelajaran mesin yang anda tidak tahu Jun 05, 2024 pm 08:51 PM

Pembelajaran mesin ialah cabang penting kecerdasan buatan yang memberikan komputer keupayaan untuk belajar daripada data dan meningkatkan keupayaan mereka tanpa diprogramkan secara eksplisit. Pembelajaran mesin mempunyai pelbagai aplikasi dalam pelbagai bidang, daripada pengecaman imej dan pemprosesan bahasa semula jadi kepada sistem pengesyoran dan pengesanan penipuan, dan ia mengubah cara hidup kita. Terdapat banyak kaedah dan teori yang berbeza dalam bidang pembelajaran mesin, antaranya lima kaedah yang paling berpengaruh dipanggil "Lima Sekolah Pembelajaran Mesin". Lima sekolah utama ialah sekolah simbolik, sekolah sambungan, sekolah evolusi, sekolah Bayesian dan sekolah analogi. 1. Simbolisme, juga dikenali sebagai simbolisme, menekankan penggunaan simbol untuk penaakulan logik dan ekspresi pengetahuan. Aliran pemikiran ini percaya bahawa pembelajaran adalah proses penolakan terbalik, melalui sedia ada

AI yang boleh dijelaskan: Menerangkan model AI/ML yang kompleks AI yang boleh dijelaskan: Menerangkan model AI/ML yang kompleks Jun 03, 2024 pm 10:08 PM

Penterjemah |. Disemak oleh Li Rui |. Chonglou Model kecerdasan buatan (AI) dan pembelajaran mesin (ML) semakin kompleks hari ini, dan output yang dihasilkan oleh model ini adalah kotak hitam – tidak dapat dijelaskan kepada pihak berkepentingan. AI Boleh Dijelaskan (XAI) bertujuan untuk menyelesaikan masalah ini dengan membolehkan pihak berkepentingan memahami cara model ini berfungsi, memastikan mereka memahami cara model ini sebenarnya membuat keputusan, dan memastikan ketelusan dalam sistem AI, Amanah dan akauntabiliti untuk menyelesaikan masalah ini. Artikel ini meneroka pelbagai teknik kecerdasan buatan (XAI) yang boleh dijelaskan untuk menggambarkan prinsip asasnya. Beberapa sebab mengapa AI boleh dijelaskan adalah penting Kepercayaan dan ketelusan: Untuk sistem AI diterima secara meluas dan dipercayai, pengguna perlu memahami cara keputusan dibuat

See all articles