Rumah Peranti teknologi AI Sapu 99 sub-misi dengan KPM! Universiti Zhejiang dan lain-lain mencadangkan strategi robot am baharu GeRM

Sapu 99 sub-misi dengan KPM! Universiti Zhejiang dan lain-lain mencadangkan strategi robot am baharu GeRM

Apr 17, 2024 pm 11:40 PM
git ai Model

Pembelajaran robot berbilang tugas adalah sangat penting dalam menangani senario yang pelbagai dan kompleks. Walau bagaimanapun, kaedah semasa dihadkan oleh isu prestasi dan kesukaran dalam mengumpul set data latihan.

Kertas kerja ini mencadangkan GeRM (Model Robot Generik), di mana penyelidik memanfaatkan pembelajaran tetulang luar talian untuk mengoptimumkan strategi penggunaan data, belajar daripada demonstrasi dan data suboptimum, dengan itu mengatasi batasan demonstrasi manusia.

Sapu 99 sub-misi dengan KPM! Universiti Zhejiang dan lain-lain mencadangkan strategi robot am baharu GeRM

Pengarang: Song Wenxuan, Zhao Han, Ding Pengxiang, Cui Can, Lu Shangke, Fan Yaning, Wang Donglin

Pengarang: West Lake University, Zhejiang University

alamat: https

//arxiv.org/abs/2403.13358

Alamat projek: https://songwxuan.github.io/GeRM/

Kemudian model berbilang bahasa-tindakan penglihatan berasaskan Transformer digunakan untuk memproses berbilang bahasa tindakan input dan output.

Dengan memperkenalkan struktur hibrid pakar, GeRM mencapai kelajuan inferens yang lebih pantas dan kapasiti model keseluruhan yang lebih tinggi, dengan itu menyelesaikan masalah volum parameter pembelajaran pengukuhan terhad, meningkatkan prestasi model dalam pembelajaran pelbagai tugas, dan pada masa yang sama mengawal untuk mengira kos.

Ia dibuktikan melalui satu siri eksperimen bahawa GeRM mengatasi kaedah lain dalam semua tugas, sambil mengesahkan kecekapannya dalam proses latihan dan inferens.

Selain itu, penyelidik juga menyediakan set data QUARD-Auto untuk menyokong latihan Pembinaan set data ini mengikut paradigma baharu pengumpulan data automasi yang dicadangkan dalam artikel ini dan menggalakkan pembelajaran pelbagai tugasan.

Sumbangan utama:

1. Mencadangkan buat pertama kalinya model pakar hibrid untuk pembelajaran tetulang berkaki empat, yang dilatih mengenai data berkualiti campuran dan berpotensi untuk mempelajari strategi optimum.

2 Berbanding dengan kaedah sedia ada, GeRM menunjukkan kadar kejayaan yang lebih tinggi apabila hanya mengaktifkan 1/2 daripada parameternya sendiri, mengaktifkan keupayaan kemunculan dan menunjukkan penggunaan data yang lebih baik semasa proses latihan.

3. Mencadangkan paradigma untuk pengumpulan set data robot automatik sepenuhnya, dan mengumpul set data sumber terbuka berskala besar.

Kaedah

Struktur rangkaian GeRM ditunjukkan dalam Rajah 1. Input visual-linguistik termasuk data demonstrasi dan data kegagalan dimasukkan ke dalam penyahkod struktur pakar hibrid 8 lapisan selepas melalui pengekod dan tokenizer masing-masing, dan menjana token tindakan , dan akhirnya ditukar kepada data tindakan robot diskret dan digunakan kepada robot melalui strategi asas Selain itu, kami menggunakan pembelajaran pengukuhan untuk latihan.

Sapu 99 sub-misi dengan KPM! Universiti Zhejiang dan lain-lain mencadangkan strategi robot am baharu GeRM

Rajah 1 Gambar rajah struktur rangkaian GeRM

Dekoder GeRM ialah model seni bina Penyahkod Transformer, di mana rangkaian suapan hadapan (FFN) dipilih daripada set 8 rangkaian pakar yang berbeza.

Di setiap lapisan, untuk setiap token, rangkaian berpagar memilih dua pakar untuk memproses token dan menggabungkan output mereka dengan cara yang wajar.

Pakar yang berbeza mahir dalam tugasan yang berbeza/dimensi tindakan yang berbeza untuk menyelesaikan masalah dalam senario yang berbeza, dengan itu mempelajari model biasa merentas pelbagai tugas. Seni bina ini mengembangkan jumlah parameter rangkaian sambil mengekalkan kos pengiraan pada dasarnya tidak berubah.

Sapu 99 sub-misi dengan KPM! Universiti Zhejiang dan lain-lain mencadangkan strategi robot am baharu GeRM

Rajah 2 Diagram struktur penyahkod

Kami mencadangkan paradigma automatik untuk mengumpul data berbilang modal daripada robot. Dengan cara ini, kami membina QUARD-Auto, set data robotik berskala besar yang mengandungi gabungan data demonstrasi dan suboptimum. Ia termasuk 5 tugasan dan 99 subtugas, dengan sejumlah 257k trajektori. Kami akan membuka sumber untuk mempromosikan pembangunan komuniti robotik.

Sapu 99 sub-misi dengan KPM! Universiti Zhejiang dan lain-lain mencadangkan strategi robot am baharu GeRM

Jadual 1 Pengenalan set data

Sapu 99 sub-misi dengan KPM! Universiti Zhejiang dan lain-lain mencadangkan strategi robot am baharu GeRM

Rajah 3 Statistik volum data

🎜

Eksperimen

Kami menjalankan satu siri percubaan yang komprehensif dan mantap meliputi kesemua 99 subtugasan, setiap satunya telah diuji dengan teliti pada 400 trajektori.

Seperti yang ditunjukkan dalam Jadual 1, GeRM mempunyai kadar kejayaan tertinggi antara semua tugasan. Berbanding dengan RT-1 dan varian lain GeRM, ia secara berkesan belajar daripada data berkualiti campuran, mengatasi kaedah lain dan mempamerkan keupayaan unggul dalam pelbagai tugas. Pada masa yang sama, modul KPM mengimbangi kos pengiraan dan prestasi dengan mengaktifkan beberapa parameter semasa inferens.

Sapu 99 sub-misi dengan KPM! Universiti Zhejiang dan lain-lain mencadangkan strategi robot am baharu GeRM

Jadual 2 Percubaan perbandingan pelbagai tugas

GeRM menunjukkan kecekapan latihan yang dipuji. Berbanding dengan kaedah lain, GeRM mencapai kerugian yang sangat rendah dan kadar kejayaan yang tinggi dengan hanya beberapa kelompok, menyerlahkan keupayaan GeRM untuk mengoptimumkan strategi penggunaan data.

Sapu 99 sub-misi dengan KPM! Universiti Zhejiang dan lain-lain mencadangkan strategi robot am baharu GeRM

Rajah 4 Kadar kejayaan/Keluk perubahan kerugian

GeRM telah menunjukkan keupayaan yang muncul dalam perancangan laluan adaptif dinamik. Seperti yang ditunjukkan dalam video, robot berkaki empat mempunyai medan pandangan yang terhad pada kedudukan awal, menjadikannya sukar untuk menentukan arah pergerakan. Untuk mengelakkan halangan, ia secara rawak memilih untuk membelok ke kiri.

Selepas itu, apabila menemui input visual yang salah, robot melakukan orientasi semula drastik untuk menjajarkan dengan sasaran yang betul di luar medan pandangan asal. Ia kemudiannya meneruskan ke destinasinya, akhirnya menyelesaikan misinya.

Perlu diperhatikan bahawa trajektori sedemikian tidak termasuk dalam pengedaran set data latihan kami. Ini menunjukkan keupayaan muncul GeRM untuk perancangan laluan adaptif dinamik dalam konteks adegan, iaitu, keupayaannya untuk membuat keputusan berdasarkan persepsi visual, merancang laluan masa depan dan mengubah langkah seterusnya mengikut keperluan.

Sapu 99 sub-misi dengan KPM! Universiti Zhejiang dan lain-lain mencadangkan strategi robot am baharu GeRM

Rajah 5 Keupayaan yang muncul

Atas ialah kandungan terperinci Sapu 99 sub-misi dengan KPM! Universiti Zhejiang dan lain-lain mencadangkan strategi robot am baharu GeRM. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)
1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Tetapan grafik terbaik
1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌
Akan R.E.P.O. Ada Crossplay?
1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Cara menggunakan komitmen git Cara menggunakan komitmen git Apr 17, 2025 pm 03:57 PM

Git Commit adalah arahan yang merekodkan fail perubahan kepada repositori git untuk menyelamatkan gambar keadaan semasa projek. Cara menggunakannya adalah seperti berikut: Tambahkan perubahan ke kawasan penyimpanan sementara Tulis mesej penyerahan ringkas dan bermaklumat untuk menyimpan dan keluar dari mesej penyerahan untuk melengkapkan penyerahan secara opsyen: Tambahkan tandatangan untuk log penyerahan Git Log untuk melihat kandungan penyerahan

Cara memadam repositori dengan git Cara memadam repositori dengan git Apr 17, 2025 pm 04:03 PM

Untuk memadam repositori Git, ikuti langkah -langkah ini: Sahkan repositori yang anda mahu padamkan. Penghapusan repositori tempatan: Gunakan perintah RM -RF untuk memadam foldernya. Jauh memadam gudang: Navigasi ke tetapan gudang, cari pilihan "Padam Gudang", dan sahkan operasi.

Cara menyelesaikan kerumitan pemasangan WordPress dan kemas kini menggunakan komposer Cara menyelesaikan kerumitan pemasangan WordPress dan kemas kini menggunakan komposer Apr 17, 2025 pm 10:54 PM

Apabila menguruskan laman web WordPress, anda sering menghadapi operasi kompleks seperti pemasangan, kemas kini, dan penukaran berbilang tapak. Operasi ini bukan sahaja memakan masa, tetapi juga terdedah kepada kesilapan, menyebabkan laman web lumpuh. Menggabungkan arahan teras WP-CLI dengan komposer dapat memudahkan tugas-tugas ini, meningkatkan kecekapan dan kebolehpercayaan. Artikel ini akan memperkenalkan cara menggunakan komposer untuk menyelesaikan masalah ini dan meningkatkan kemudahan pengurusan WordPress.

Cara Menambah Kekunci Awam ke Akaun Git Cara Menambah Kekunci Awam ke Akaun Git Apr 17, 2025 pm 02:42 PM

Bagaimana untuk menambah kunci awam ke akaun Git? Langkah: Menjana pasangan kunci SSH. Salin kunci awam. Tambah kunci awam di Gitlab atau GitHub. Uji sambungan SSH.

Cara Menangani Konflik Kod Git Cara Menangani Konflik Kod Git Apr 17, 2025 pm 02:51 PM

Konflik kod merujuk kepada konflik yang berlaku apabila pelbagai pemaju mengubah suai kod yang sama dan menyebabkan Git bergabung tanpa memilih perubahan secara automatik. Langkah -langkah resolusi termasuk: Buka fail yang bercanggah dan cari kod yang bercanggah. Gabungkan kod secara manual dan salin perubahan yang anda mahu masuk ke dalam penanda konflik. Padam tanda konflik. Simpan dan serahkan perubahan.

Cara memuat turun projek git ke tempatan Cara memuat turun projek git ke tempatan Apr 17, 2025 pm 04:36 PM

Untuk memuat turun projek secara tempatan melalui Git, ikuti langkah -langkah ini: pasang git. Navigasi ke direktori projek. Pengklonan Repositori Jauh menggunakan arahan berikut: Git Clone https://github.com/username/repository-name.git

Apa yang Harus Dilakukan Sekiranya Muat turun Git Tidak Aktif Apa yang Harus Dilakukan Sekiranya Muat turun Git Tidak Aktif Apr 17, 2025 pm 04:54 PM

Selesaikan: Apabila kelajuan muat turun git perlahan, anda boleh mengambil langkah -langkah berikut: periksa sambungan rangkaian dan cuba menukar kaedah sambungan. Mengoptimumkan Konfigurasi Git: Meningkatkan Saiz Penampan Pos (Git Config-Global Http.PostBuffer 524288000), dan mengurangkan had berkelajuan rendah (git config --global http.lowspeedlimit 1000). Gunakan proksi Git (seperti Git-Proxy atau Git-LFS-Proxy). Cuba gunakan klien Git yang berbeza (seperti sourcetree atau github desktop). Periksa perlindungan kebakaran

Bagaimana menyelesaikan masalah carian yang cekap dalam projek PHP? Jenis membantu anda mencapainya! Bagaimana menyelesaikan masalah carian yang cekap dalam projek PHP? Jenis membantu anda mencapainya! Apr 17, 2025 pm 08:15 PM

Apabila membangunkan laman web e-dagang, saya menghadapi masalah yang sukar: bagaimana untuk mencapai fungsi carian yang cekap dalam sejumlah besar data produk? Carian pangkalan data tradisional tidak cekap dan mempunyai pengalaman pengguna yang lemah. Selepas beberapa penyelidikan, saya dapati jenis enjin carian dan menyelesaikan masalah ini melalui PHP pelanggan PHP TypeSense/TypeSense-PHP, yang meningkatkan prestasi carian.

See all articles