Berjalan 'anjing' di atas bola yoga! Eureka, dipilih sebagai salah satu daripada sepuluh projek teratas NVIDIA, telah membuat satu kejayaan baharu-AI-php.cn

Rumah

Berjalan 'anjing' di atas bola yoga! Eureka, dipilih sebagai salah satu daripada sepuluh projek teratas NVIDIA, telah membuat satu kejayaan baharu

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

May 05, 2024 pm 01:01 PM

git projek dreureka

Anjing robot berjalan dengan mantap di atas bola yoga, dan keseimbangannya agak baik:

Berjalan anjing di atas bola yoga! Eureka, dipilih sebagai salah satu daripada sepuluh projek teratas NVIDIA, telah membuat satu kejayaan baharu

Ia boleh mengendalikan pelbagai adegan, sama ada ia adalah kaki lima yang rata atau halaman yang mencabar, ia boleh memuatkan:

Berjalan anjing di atas bola yoga! Eureka, dipilih sebagai salah satu daripada sepuluh projek teratas NVIDIA, telah membuat satu kejayaan baharu

Malah apabila penyelidik menendang bola yoga, anjing robot itu tidak akan terbalik:

Berjalan anjing di atas bola yoga! Eureka, dipilih sebagai salah satu daripada sepuluh projek teratas NVIDIA, telah membuat satu kejayaan baharu

Anjing robot juga boleh mengekalkan keseimbangan semasa mengempiskan belon:

Berjalan anjing di atas bola yoga! Eureka, dipilih sebagai salah satu daripada sepuluh projek teratas NVIDIA, telah membuat satu kejayaan baharu

Demonstrasi di atas semuanya pada kelajuan 1x, tanpa pemprosesan pecutan.

Alamat kertas: https://eureka-research.github.io/dr-eureka/assets/dreureka-paper.pdf
Laman utama projek: https://github.com/eureka- research/DrEureka
Tajuk kertas: DrEureka: Language Model Guided Sim-To-Real Transfer

Penyelidikan ini dicipta bersama oleh penyelidik dari University of Pennsylvania, NVIDIA, dan University of Texas di Austin , dan merupakan sumber terbuka sepenuhnya. Mereka mencadangkan DrEureka (Domain Randomized Eureka), algoritma baharu yang menggunakan LLM untuk melaksanakan reka bentuk ganjaran dan konfigurasi parameter rawak domain, yang boleh mencapai pemindahan simulasi-ke-realiti secara serentak. Kajian itu menunjukkan keupayaan algoritma DrEureka untuk menyelesaikan tugas robotik baru, seperti mengimbangi robot berkaki empat dan berjalan di atas bola yoga, tanpa memerlukan reka bentuk manual berulang.

DrEureka berdasarkan Eureka, yang turut dinamakan sebagai salah satu daripada sepuluh projek NVIDIA terbaik pada tahun 2023. Untuk mengetahui lebih lanjut tentang Eureka, sila rujuk "Dengan GPT-4, robot telah belajar cara memutar pen dan plat walnut".

Dalam bahagian abstrak kertas kerja, para penyelidik menyatakan bahawa memindahkan strategi yang dipelajari dalam simulasi ke dunia nyata adalah strategi yang menjanjikan untuk pemerolehan kemahiran robot secara besar-besaran. Walau bagaimanapun, pendekatan simulasi-ke-realiti sering bergantung pada reka bentuk manual dan penalaan fungsi ganjaran tugasan dan parameter fizikal simulasi, yang menjadikan proses itu perlahan dan intensif buruh. Kertas kerja ini mengkaji penggunaan model bahasa besar (LLM) untuk mengautomasikan dan mempercepatkan reka bentuk simulasi-ke-realistik.

Jim Fan, salah seorang pengarang kertas kerja dan saintis kanan di NVIDIA, turut mengambil bahagian dalam penyelidikan ini. Sebelum ini, Nvidia menubuhkan makmal AI, diketuai oleh Jim Fan, yang mengkhususkan diri dalam kecerdasan yang terkandung. Jim Fan berkata:

"Kami melatih anjing robot untuk mengimbangi dan berjalan di atas bola yoga. Ini dilakukan sepenuhnya dalam simulasi, dan kemudian dipindahkan ke dunia nyata dengan sampel sifar, tanpa penalaan halus, dan berlari terus . untuk mengawal bola di pelbagai medan , atau malah pergi ke sisi! 4 LLM canggih sedemikian mempunyai banyak intuisi fizikal terbina dalam, termasuk geseran, redaman, kekakuan, graviti, dll. Dengan GPT-4, DrEureka boleh melaraskan parameter ini dengan mahir dan menerangkan alasannya dengan baik 》

Pengenalan kertas

Proses DrEureka adalah seperti berikut, yang menerima arahan tugas dan keselamatan serta kod sumber persekitaran, serta menjalankan Eureka untuk menjana fungsi dan dasar ganjaran yang teratur. Ia kemudiannya menguji strategi di bawah keadaan simulasi yang berbeza untuk membina sebelum fizikal yang sedar ganjaran, yang disalurkan kepada LLM untuk menjana satu set parameter rawak domain (DR). Akhir sekali, dasar ini dilatih menggunakan ganjaran tersintesis dan parameter DR untuk penggunaan sebenar.

Rekaan Ganjaran Eureka. Komponen reka bentuk ganjaran adalah berdasarkan Eureka kerana kesederhanaan dan ekspresifnya, tetapi kertas kerja ini memperkenalkan beberapa penambahbaikan untuk meningkatkan kebolehgunaannya daripada simulasi kepada persekitaran kehidupan sebenar. Pseudokod adalah seperti berikut:

Ganjaran fizik sedar sebelum (RAPP, fizik sedar ganjaran sebelumnya). Fungsi ganjaran keselamatan boleh mengawal tingkah laku dasar untuk menetapkan pilihan persekitaran, tetapi tidak mencukupi dengan sendirinya untuk mencapai pemindahan simulasi kepada realiti. Oleh itu, kertas kerja ini memperkenalkan mekanisme RAPP mudah untuk mengehadkan skop asas LLM.

LLM digunakan untuk rawak domain. Memandangkan julat RAPP untuk setiap parameter DR, langkah terakhir DrEureka mengarahkan LLM untuk menjana konfigurasi rawak domain dalam had julat RAPP. Lihat Rajah 3 untuk proses khusus:

Penyelidikan ini menggunakan Unitree Go1 untuk eksperimen Go1 ialah robot berkaki empat kecil dengan 12 darjah kebebasan dalam empat kakinya. Dalam tugas pergerakan empat kaki, makalah ini juga menilai secara sistematik prestasi dasar DrEureka pada beberapa rupa bumi sebenar dan mendapati bahawa ia kekal teguh dan mengatasi prestasi dasar yang dilatih menggunakan ganjaran rekaan manusia dan konfigurasi DR.

Untuk maklumat lanjut, sila rujuk kertas asal.

Atas ialah kandungan terperinci Berjalan 'anjing' di atas bola yoga! Eureka, dipilih sebagai salah satu daripada sepuluh projek teratas NVIDIA, telah membuat satu kejayaan baharu. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

Menjana ai hentai secara percuma.

Tunjukkan Lagi

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)

3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Tetapan grafik terbaik

3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Penyelesaian Riddle Seashell

2 minggu yang lalu By DDD

R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa

3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

WWE 2K25: Cara Membuka Segala -galanya Di Myrise

4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Tunjukkan Lagi

Alat panas

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Tunjukkan Lagi

Topik panas

Di manakah pintu masuk log masuk untuk e-mel gmail?

7472

Tutorial CakePHP

1377

Apakah format nama akaun stim

kunci pengaktifan win11 kekal

Sambungan NYT menunjukkan dan jawapan

Tunjukkan Lagi

Related knowledge

Perpustakaan apa yang digunakan untuk operasi nombor terapung di GO? Apr 02, 2025 pm 02:06 PM

Perpustakaan yang digunakan untuk operasi nombor terapung dalam bahasa Go memperkenalkan cara memastikan ketepatannya ...

Cara Menjalankan Projek H5 Apr 06, 2025 pm 12:21 PM

Menjalankan projek H5 memerlukan langkah -langkah berikut: memasang alat yang diperlukan seperti pelayan web, node.js, alat pembangunan, dan lain -lain. Membina persekitaran pembangunan, membuat folder projek, memulakan projek, dan menulis kod. Mulakan pelayan pembangunan dan jalankan arahan menggunakan baris arahan. Pratonton projek dalam penyemak imbas anda dan masukkan URL Server Pembangunan. Menerbitkan projek, mengoptimumkan kod, menggunakan projek, dan menyediakan konfigurasi pelayan web.

GITEE PAGES PENYEDIAAN LAMAN WEB STATIC Gagal: Bagaimana menyelesaikan masalah dan menyelesaikan kesilapan fail tunggal 404? Apr 04, 2025 pm 11:54 PM

Giteepages Statik Laman Web Penggunaan Gagal: 404 Penyelesaian Masalah dan Resolusi Ralat Semasa Menggunakan Gitee ...

Perpustakaan mana yang dibangunkan oleh syarikat besar atau disediakan oleh projek sumber terbuka yang terkenal? Apr 02, 2025 pm 04:12 PM

Perpustakaan mana yang dibangunkan oleh syarikat besar atau projek sumber terbuka yang terkenal? Semasa pengaturcaraan di GO, pemaju sering menghadapi beberapa keperluan biasa, ...

Bagaimana cara menentukan pangkalan data yang berkaitan dengan model dalam beego orm? Apr 02, 2025 pm 03:54 PM

Di bawah rangka kerja beegoorm, bagaimana untuk menentukan pangkalan data yang berkaitan dengan model? Banyak projek beego memerlukan pelbagai pangkalan data untuk dikendalikan secara serentak. Semasa menggunakan beego ...

Adakah pengeluaran halaman H5 memerlukan penyelenggaraan berterusan? Apr 05, 2025 pm 11:27 PM

Halaman H5 perlu dikekalkan secara berterusan, kerana faktor -faktor seperti kelemahan kod, keserasian pelayar, pengoptimuman prestasi, kemas kini keselamatan dan peningkatan pengalaman pengguna. Kaedah penyelenggaraan yang berkesan termasuk mewujudkan sistem ujian lengkap, menggunakan alat kawalan versi, kerap memantau prestasi halaman, mengumpul maklum balas pengguna dan merumuskan pelan penyelenggaraan.

Bagaimana menyelesaikan masalah penukaran jenis user_id semasa menggunakan aliran redis untuk melaksanakan beratur mesej dalam bahasa Go? Apr 02, 2025 pm 04:54 PM

Masalah menggunakan redisstream untuk melaksanakan beratur mesej dalam bahasa Go menggunakan bahasa Go dan redis ...

Typecho Route Conflict Conflict: Kenapa saya/TEST/TAG/HIS/10086 Pencocokan TestTagIndex dan bukannya TestTagPage? Apr 01, 2025 am 09:03 AM

TypeCho Routing Pencocokan Peraturan Analisis dan Penyiasatan Masalah Artikel ini akan menganalisis dan menjawab soalan mengenai hasil yang tidak konsisten dari pendaftaran routing plug-in typecho dan hasil padanan sebenar ...

See all articles