Robot Google mencapai bahasa interaktif dengan ketepatan sehingga 93.5%, dan jumlah data sumber terbuka meningkat sepuluh kali ganda.-AI-php.cn

Jadual Kandungan

Tanda Aras Sumber Terbuka

Pembelajaran tingkah laku bahasa masa nyata

Kesimpulan

Rumah

Peranti teknologi

Robot Google mencapai bahasa interaktif dengan ketepatan sehingga 93.5%, dan jumlah data sumber terbuka meningkat sepuluh kali ganda.

PHPz

Apr 21, 2023 pm 07:34 PM

Google robot

Lihat, lelaki di hadapan anda sentiasa memberi arahan bahasa semula jadi kepada robot, seperti "Tolak bintang hijau di antara blok merah", "Alihkan blok biru ke sudut kiri bawah ", robot boleh melengkapkan setiap arahan input dalam masa nyata.

Sejak tahun 1960-an, pakar robotik telah cuba membuat robot memahami "arahan bahasa semula jadi" orang dan melakukan tindakan tertentu.

Sebaik-baiknya, robot masa hadapan akan bertindak balas dalam masa nyata terhadap sebarang tugasan berkaitan yang boleh diterangkan oleh pengguna dalam bahasa semula jadi.

Terutama dalam persekitaran manusia yang terbuka, pengguna mungkin perlu menyesuaikan gelagat robot apabila ia berlaku, memberikan pembetulan pantas, seperti "berhenti, gerakkan tangan ke atas sedikit" atau nyatakan Hadkan "Bergerak perlahan ke kanan".

Robot Google mencapai bahasa interaktif dengan ketepatan sehingga 93.5%, dan jumlah data sumber terbuka meningkat sepuluh kali ganda.

Selain itu, bahasa masa nyata boleh memudahkan orang ramai dan robot bekerjasama dalam tugas jangka panjang yang kompleks, dan orang boleh membimbing robot secara berulang dan interaktif Operasi, kadangkala akan ada maklum balas lisan.

Kerja berkaitan semasa boleh dibahagikan secara kasar kepada tiga bahagian berikut:

1 ;

2 Dapat bertindak balas kepada sejumlah besar arahan bahasa semula jadi yang kaya; interaktif) arahan bahasa , iaitu robot perlu menerima arahan bahasa semula jadi baharu semasa pelaksanaan tugas.

Bagi titik ketiga, kelajuan pembangunan interaktif semasa dalam bidang robot masih sangat perlahan, yang juga menyebabkan robot tidak mempunyai "sense of life".

Baru-baru ini Google telah menerbitkan kertas kerja yang mencadangkan rangka kerja serba baharu yang boleh menghasilkan dunia sebenar, robot interaktif masa nyata yang melaksanakan arahan bahasa semula jadi, serta set data dan persekitaran yang berkaitan, penanda aras dan strategi semua ada.

Pautan kertas: https://arxiv.org/pdf/2210.06407.pdf Robot Google mencapai bahasa interaktif dengan ketepatan sehingga 93.5%, dan jumlah data sumber terbuka meningkat sepuluh kali ganda.

Laman utama projek: https://interactive-language.github.io/

Dengan menganalisis set data ratusan ribu anotasi bahasa trajektori Menjalankan latihan pengklonan tingkah laku, dasar yang terhasil dengan mahir boleh melaksanakan perintah magnitud lebih banyak daripada kerja sebelumnya yang dicapai. Di dunia nyata, para penyelidik menganggarkan bahawa kaedah itu mempunyai kadar kejayaan 93.5% pada 87,000 rentetan bahasa semula jadi yang berbeza.

Dan strategi yang sama boleh dipandu oleh manusia dalam masa nyata melalui bahasa semula jadi untuk menyelesaikan pelbagai sasaran penyusunan semula jarak jauh yang tepat, seperti sebagai "menggunakan Buat muka tersenyum dengan blok bangunan" dsb.

Robot Google mencapai bahasa interaktif dengan ketepatan sehingga 93.5%, dan jumlah data sumber terbuka meningkat sepuluh kali ganda.

Set data yang dikeluarkan bersama kertas termasuk hampir 600,000 trajektori berteg bahasa, yang merupakan susunan magnitud yang lebih besar daripada set data yang tersedia sebelum ini.

Bahasa interaktif: perbualan masa nyata dengan robot

Untuk menyepadukan robot ke dalam dunia nyata, perkara yang paling penting ialah dapat memproses bahasa semula jadi yang terbuka arahan, tetapi dari mesin Dari perspektif pembelajaran, mendapatkan robot untuk mempelajari bahasa perbendaharaan kata terbuka adalah satu cabaran yang besar.

Model perwakilan terbuka perlu melaksanakan sejumlah besar tugas, termasuk arahan pembetulan kecil, dsb. Persediaan pembelajaran berbilang tugas sedia ada menggunakan set data pembelajaran tiruan yang direka dengan teliti atau fungsi ganjaran pembelajaran pengukuhan yang kompleks untuk memacu pembelajaran bagi setiap tugasan, dan set pratakrif yang direka bentuk dengan cara ini ditakdirkan untuk tidak terlalu besar.

Oleh itu, persoalan utama dalam tugas perbendaharaan kata terbuka ialah: bagaimana untuk melanjutkan proses pengumpulan data robot untuk meliputi beribu-ribu tindakan dalam persekitaran sebenar, dan Bagaimana anda menyambungkan semua tingkah laku ini kepada arahan bahasa semula jadi yang mungkin diberikan oleh pengguna akhir?

Dalam bahasa interaktif, kunci kepada rangka kerja pembelajaran simulasi berskala besar yang dicadangkan oleh Google ialah skalabiliti mencipta set data demonstrasi robot berbilang bahasa yang besar dan berhawa dingin.

Tidak seperti persediaan sebelumnya di mana semua kemahiran ditakrifkan dan kemudian demonstrasi susun atur bagi setiap kemahiran dikumpulkan, penyelidik terus bekerja merentasi berbilang robot tanpa tetapan semula adegan ) atau pembahagian kemahiran tahap rendah .

Semua data, termasuk data yang gagal (seperti mengetuk blok dari jadual), mesti melalui proses pelabelan semula bahasa HindSight sebelum dipasangkan dengan teks.

Dalam proses ini, annotator perlu menonton video robot yang panjang untuk mengenal pasti sebanyak mungkin gelagat, menandakan masa mula dan tamat setiap tingkah laku dan menggunakan bentuk bahasa Semula jadi tanpa had untuk menerangkan setiap serpihan.

Perkara yang paling penting ialah berbanding dengan bootstrapping yang ditetapkan sebelum ini, semua kemahiran yang digunakan untuk latihan didedahkan dari bawah ke atas daripada data itu sendiri, bukannya pra-ditetapkan oleh penyelidik Sudah pasti.

Robot Google mencapai bahasa interaktif dengan ketepatan sehingga 93.5%, dan jumlah data sumber terbuka meningkat sepuluh kali ganda.

Penyelidik sengaja memudahkan kaedah pembelajaran dan seni bina sebaik mungkin. Rangkaian Dasar Robot ialah Transformer perhatian silang yang menggabungkan video 5 Hz dan teks. Pemetaan kepada gerakan robot 5 Hz, sasaran diklon menggunakan tingkah laku pembelajaran diselia standard tanpa kehilangan tambahan.

Semasa menguji, arahan bahasa semula jadi baharu boleh dihantar ke rangkaian dasar melalui pertuturan ke teks pada kadar sehingga 5 Hz.

Tanda Aras Sumber Terbuka

Semasa proses anotasi, penyelidik mengumpul set data Jadual Bahasa yang mengandungi lebih daripada 440,000 sebenar dan 180,000 perlaksanaan robot simulasi Demonstrasi arahan semula jadi secara lisan , dan urutan tindakan yang diambil oleh robot semasa demonstrasi.

Robot Google mencapai bahasa interaktif dengan ketepatan sehingga 93.5%, dan jumlah data sumber terbuka meningkat sepuluh kali ganda.

Ini juga merupakan set data demonstrasi robot berhawa dingin terbesar pada masa ini, ditambah baik secara langsung mengikut susunan magnitud.

Language-Table telah melancarkan penanda aras pembelajaran simulasi, yang boleh digunakan untuk pemilihan model atau untuk menilai keupayaan robot yang dilatih dengan kaedah berbeza untuk melaksanakan arahan.

Pembelajaran tingkah laku bahasa masa nyata

Dalam eksperimen, para penyelidik mendapati bahawa keupayaan robot akan menjadi sangat berkuasa apabila ia boleh mengikut input arahan bahasa semula jadi dalam masa nyata .

Di tapak web projek, penyelidik menunjukkan bahawa pengguna boleh membimbing robot melalui jujukan ufuk panjang yang kompleks untuk menyelesaikan masalah jangka panjang hanya menggunakan bahasa semula jadi Matlamat kawalan terkoordinasi yang tepat.

Robot Google mencapai bahasa interaktif dengan ketepatan sehingga 93.5%, dan jumlah data sumber terbuka meningkat sepuluh kali ganda.

Sebagai contoh, jika terdapat banyak blcok di atas meja, arahannya boleh menjadi "Buat wajah tersenyum dengan mata hijau" atau "Letakkannya semuanya dalam garis menegak "Naik" dan seterusnya.

Oleh kerana robot telah dilatih untuk mengikuti bahasa leksikon terbuka, eksperimen melihat robot bertindak balas terhadap pelbagai pembetulan lisan yang berbeza, seperti "Gerak bintang merah secara perlahan-lahan." ".

Akhir sekali, penyelidik meneroka kelebihan bahasa masa nyata, seperti menjadikan pengumpulan data robot lebih cekap Seorang pengendali manusia boleh mengawal empat robot pada masa yang sama menggunakan bahasa pertuturan adalah mungkin Meningkatkan pengumpulan data robot pada masa hadapan tanpa perlu melengkapkan setiap robot dengan annotator.

Kesimpulan

Walaupun projek pada masa ini terhad kepada set tetap objek pada desktop, hasil percubaan pada bahasa interaktif boleh memberikan petunjuk awal bahawa pembelajaran tiruan berskala besar sememangnya boleh menghasilkan sebenar -time interactive Bot yang mampu mengikuti arahan pengguna akhir bentuk bebas.

Untuk menggalakkan kemajuan teknologi kawalan bahasa masa nyata untuk robot fizikal, penyelidik telah menggunakan Jadual Bahasa sumber terbuka, yang kini merupakan set data demonstrasi robot dunia sebenar terbesar berdasarkan pada keadaan bahasa Ia juga boleh digunakan sebagai tanda aras simulasi Berkaitan.

Para penyelidik percaya bahawa peranan set data ini mungkin bukan sahaja terhad kepada bidang kawalan robot, tetapi juga boleh digunakan untuk mengkaji bahasa dan ramalan video bersyarat tindakan, video robot pemodelan bahasa bersyarat, atau dalam Ia menyediakan titik permulaan baharu untuk mengkaji banyak lagi masalah menarik dan aktif dalam konteks pembelajaran mesin yang lebih luas.

Atas ialah kandungan terperinci Robot Google mencapai bahasa interaktif dengan ketepatan sehingga 93.5%, dan jumlah data sumber terbuka meningkat sepuluh kali ganda.. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

Menjana ai hentai secara percuma.

Tunjukkan Lagi

Artikel Panas

Assassin's Creed Shadows: Penyelesaian Riddle Seashell

3 minggu yang lalu By DDD

Apa yang Baru di Windows 11 KB5054979 & Cara Memperbaiki Masalah Kemas Kini

2 minggu yang lalu By DDD

Di mana untuk mencari kad kunci kawalan kren di atomfall

3 minggu yang lalu By DDD

Penjimatan di R.E.P.O. Dijelaskan (dan simpan fail)

1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows - Cara Mencari Orang Panda

4 minggu yang lalu By DDD

Tunjukkan Lagi

Alat panas

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Tunjukkan Lagi

Topik panas

Di manakah pintu masuk log masuk untuk e-mel gmail?

7569

Tutorial CakePHP

1386

Apakah format nama akaun stim

kunci pengaktifan win11 kekal

Sambungan NYT menunjukkan dan jawapan

107

Tunjukkan Lagi

Related knowledge

Cara Mengulas DeepSeek Feb 19, 2025 pm 05:42 PM

DeepSeek adalah alat pengambilan maklumat yang kuat. .

Cara Mencari DeepSeek Feb 19, 2025 pm 05:39 PM

DeepSeek adalah enjin carian proprietari yang hanya mencari dalam pangkalan data atau sistem tertentu, lebih cepat dan lebih tepat. Apabila menggunakannya, pengguna dinasihatkan untuk membaca dokumen itu, cuba strategi carian yang berbeza, dapatkan bantuan dan maklum balas mengenai pengalaman pengguna untuk memanfaatkan kelebihan mereka.

Sesame Open Door Exchange Web Pautan Pautan Gerbang Perdagangan Laman Web Pendaftaran Terkini Feb 28, 2025 am 11:06 AM

Artikel ini memperkenalkan proses pendaftaran versi web Web Open Exchange (GATE.IO) dan aplikasi Perdagangan Gate secara terperinci. Sama ada pendaftaran web atau pendaftaran aplikasi, anda perlu melawat laman web rasmi atau App Store untuk memuat turun aplikasi tulen, kemudian isi nama pengguna, kata laluan, e -mel, nombor telefon bimbit dan maklumat lain, dan lengkap e -mel atau pengesahan telefon bimbit.

Mengapa pautan Bybit Exchange tidak dimuat turun dan dipasang secara langsung? Feb 21, 2025 pm 10:57 PM

Mengapa pautan Bybit Exchange tidak dimuat turun dan dipasang secara langsung? Bybit adalah pertukaran cryptocurrency yang menyediakan perkhidmatan perdagangan kepada pengguna. Aplikasi mudah alih Exchange tidak boleh dimuat turun terus melalui AppStore atau GooglePlay untuk sebab -sebab berikut: 1. Aplikasi pertukaran cryptocurrency sering tidak memenuhi keperluan ini kerana ia melibatkan perkhidmatan kewangan dan memerlukan peraturan dan standard keselamatan tertentu. 2. Undang -undang dan Peraturan Pematuhan di banyak negara, aktiviti yang berkaitan dengan urus niaga cryptocurrency dikawal atau terhad. Untuk mematuhi peraturan ini, aplikasi bybit hanya boleh digunakan melalui laman web rasmi atau saluran yang diberi kuasa lain

Platform Perdagangan Pintu Terbuka Sesame Muat turun Versi Mudah Alih Platform Perdagangan Platform Perdagangan Alamat Muat Turun Feb 28, 2025 am 10:51 AM

Adalah penting untuk memilih saluran rasmi untuk memuat turun aplikasi dan memastikan keselamatan akaun anda.

Top 10 Disyorkan untuk App Perdagangan Aset Digital Crypto (2025 Global Ranking) Mar 18, 2025 pm 12:15 PM

Artikel ini mencadangkan sepuluh platform perdagangan cryptocurrency teratas yang memberi perhatian kepada, termasuk Binance, OKX, Gate.io, Bitflyer, Kucoin, Bybit, Coinbase Pro, Kraken, BYDFI dan Xbit yang desentralisasi. Platform ini mempunyai kelebihan mereka sendiri dari segi kuantiti mata wang transaksi, jenis urus niaga, keselamatan, pematuhan, dan ciri khas. Memilih platform yang sesuai memerlukan pertimbangan yang komprehensif berdasarkan pengalaman perdagangan anda sendiri, toleransi risiko dan keutamaan pelaburan. Semoga artikel ini membantu anda mencari saman terbaik untuk diri sendiri

WEB OPEN DOOR EXCHANGE WEB PAGE LOGIN VERSI VERSI UNTUK GATEIO Laman Web Rasmi Pintu Masuk Mar 04, 2025 pm 11:48 PM

Pengenalan terperinci kepada operasi log masuk versi Web Open Exchange, termasuk langkah masuk dan proses pemulihan kata laluan.

Portal Log Masuk Versi Rasmi Binance Binance Feb 21, 2025 pm 05:42 PM

Untuk mengakses versi Login Laman Web Binance yang terkini, ikuti langkah mudah ini. Pergi ke laman web rasmi dan klik butang "Login" di sudut kanan atas. Pilih kaedah log masuk anda yang sedia ada. Masukkan nombor mudah alih berdaftar atau e -mel dan kata laluan anda dan pengesahan lengkap (seperti kod pengesahan mudah alih atau Google Authenticator). Selepas pengesahan yang berjaya, anda boleh mengakses Portal Log masuk laman web rasmi Binance.

See all articles