Rumah > Peranti teknologi > AI > teks badan

Robot DeepMind bermain pingpong, dan pukulan depan dan pukulan kilasnya tergelincir ke udara, mengalahkan manusia pemula sepenuhnya

PHPz
Lepaskan: 2024-08-09 16:01:32
asal
1051 orang telah melayarinya

Tetapi mungkin anda tidak boleh mengalahkan lelaki tua di taman?

Sukan Olimpik Paris sedang rancak berlangsung, dan pingpong telah menarik perhatian ramai. Pada masa yang sama, robot juga telah membuat penemuan baru dalam bermain pingpong.

Tadi, DeepMind mencadangkan ejen robot pembelajaran pertama yang boleh mencapai tahap pemain amatur manusia dalam pingpong yang kompetitif.

Robot DeepMind bermain pingpong, dan pukulan depan dan pukulan kilasnya tergelincir ke udara, mengalahkan manusia pemula sepenuhnya

Alamat kertas: https://arxiv.org/pdf/2408.03906

Sejauh manakah robot DeepMind ini bermain pingpong? Mungkin setanding dengan pemain amatur manusia:

Robot DeepMind bermain pingpong, dan pukulan depan dan pukulan kilasnya tergelincir ke udara, mengalahkan manusia pemula sepenuhnya

Kedua-dua pukulan depan dan kilas:

Robot DeepMind bermain pingpong, dan pukulan depan dan pukulan kilasnya tergelincir ke udara, mengalahkan manusia pemula sepenuhnya

Pihak lawan menggunakan pelbagai gaya permainan, dan robot juga boleh menahannya:

Robot DeepMind bermain pingpong, dan pukulan depan dan pukulan kilasnya tergelincir ke udara, mengalahkan manusia pemula sepenuhnya
servis putaran berbeza :

Robot DeepMind bermain pingpong, dan pukulan depan dan pukulan kilasnya tergelincir ke udara, mengalahkan manusia pemula sepenuhnya
Namun, saingan nampaknya tidak sehebat pertarungan antara lelaki tua di taman itu.

Untuk robot, pingpong memerlukan penguasaan kemahiran peringkat rendah yang kompleks dan permainan strategik, dan memerlukan latihan jangka panjang. DeepMind percaya bahawa strategi yang tidak optimum tetapi boleh melaksanakan kemahiran tahap rendah dengan cekap mungkin merupakan pilihan yang lebih baik. Ini membezakan pingpong daripada permainan strategik semata-mata seperti catur dan Go.

Oleh itu, pingpong ialah penanda aras yang berharga untuk meningkatkan keupayaan robot, termasuk pergerakan berkelajuan tinggi, membuat keputusan tepat dan strategik masa nyata, reka bentuk sistem dan persaingan langsung dengan lawan manusia.

Untuk ini, ketua saintis Google DeepMind memuji: "Robot pingpong akan membantu kami menyelesaikan masalah kawalan dan persepsi berkelajuan tinggi

Robot DeepMind bermain pingpong, dan pukulan depan dan pukulan kilasnya tergelincir ke udara, mengalahkan manusia pemula sepenuhnya
Kajian itu menjalankan 29 permainan pingpong antara robot dan manusia, termasuk Bot." memenangi 45% daripada masa (13/29). Semua pemain manusia adalah pemain yang tidak pernah dilihat oleh robot sebelum ini, dari segi kebolehan daripada pemula hingga pemain kejohanan.

Sementara bot itu tewas semua perlawanannya menentang pemain peringkat tertinggi, ia memenangi 100% perlawanannya menentang pemula dan 55% perlawanannya menentang pemain pertengahan, menunjukkan prestasi seorang amatur manusia.

Secara keseluruhannya, sumbangan penyelidikan ini termasuk:

  1. Mencadangkan seni bina dasar hierarki dan modular yang merangkumi:

  2. pengawal peringkat rendah dan deskriptor kemahiran terperinci mereka yang berguna untuk Keupayaan dan ejen adalah model. membantu merapatkan jurang antara simulasi dan realiti;

  3. Pilih pengawal peringkat tinggi dengan kemahiran peringkat rendah.

  4. Teknologi untuk melaksanakan simulasi sampel sifar kepada realiti, termasuk mentakrifkan kaedah berulang berdasarkan pengagihan tugas dunia sebenar dan mentakrifkan kurikulum automatik.

  5. Menyesuaikan diri dengan lawan yang tidak kelihatan dalam masa nyata.

Pengenalan kaedah

Ejen terdiri daripada perpustakaan kemahiran peringkat rendah dan pengawal peringkat tinggi. Kumpulan kemahiran peringkat rendah memfokuskan pada aspek tertentu pingpong, seperti pukulan atas pukulan depan, sasaran pukulan kilas atau servis pukulan depan. Selain menggabungkan strategi latihan, kajian ini juga mengumpul dan menyimpan maklumat di luar talian dan dalam talian tentang kekuatan, kelemahan dan batasan setiap kemahiran peringkat rendah. Pengawal peringkat tinggi yang bertanggungjawab untuk menyelaraskan kemahiran peringkat rendah akan memilih kemahiran terbaik berdasarkan statistik permainan semasa dan penerangan kemahiran.

Selain itu, kajian itu juga mengumpul sejumlah kecil data permainan sparring manusia dan manusia sebagai benih untuk keadaan tugas awal Set data termasuk maklumat kedudukan, kelajuan dan putaran. Ejen itu kemudiannya dilatih dalam persekitaran simulasi menggunakan pembelajaran pengukuhan dan menggunakan beberapa teknik sedia ada untuk menggunakan dasar dengan lancar kepada perkakasan sebenar.

Robot DeepMind bermain pingpong, dan pukulan depan dan pukulan kilasnya tergelincir ke udara, mengalahkan manusia pemula sepenuhnya
Ejen bermain dengan manusia untuk menjana lebih banyak data latihan Apabila robot terus belajar, standard permainan menjadi lebih kompleks, membolehkan ejen mempelajari tindakan yang lebih dan lebih kompleks. Gelung "simulasi-realiti" hibrid ini mencipta pengajaran automatik yang membolehkan kemahiran robot bertambah baik dari semasa ke semasa.

Robot DeepMind bermain pingpong, dan pukulan depan dan pukulan kilasnya tergelincir ke udara, mengalahkan manusia pemula sepenuhnya

Kawalan berlapis

Kawalan berlapis terutamanya merangkumi bahagian berikut:

  • Gaya permainan pingpong: Pengawal peringkat tinggi (HLC, pengawal peringkat tinggi) terlebih dahulu menentukan gaya permainan atau pukulan depan Pukulan kilas);

  • Pelarasan: Kekalkan keutamaan setiap HLC (nilai H) dalam talian berdasarkan statistik daripada perlawanan menentang lawan

  • Pilih kemahiran yang paling berkesan: HLC berpasangan pemain yang disenarai pendek berdasarkan persampelan nilai H yang diselaraskan;

  • Kemas kini: Nilai-H dan statistik lawan dikemas kini sehingga tamat permainan.

Robot DeepMind bermain pingpong, dan pukulan depan dan pukulan kilasnya tergelincir ke udara, mengalahkan manusia pemula sepenuhnya

Keputusan

Para penyelidik membandingkan ejen dengan 29 pemain pingpong yang berbeza tahap, termasuk kemahiran + pemula, pertengahan, lanjutan dan lanjutan. Pemain manusia bermain tiga perlawanan menentang robot mengikut peraturan pingpong standard, tetapi peraturan itu diubah suai sedikit kerana robot tidak dapat melakukan servis.

Menghadapi semua pihak lawan, robot itu memenangi 45% perlawanan dan 46% permainan. Dipecahkan mengikut tahap kemahiran, bot itu memenangi semua perlawanannya menentang pemula, kalah semua perlawanannya menentang pemain Lanjutan dan Lanjutan+ dan memenangi 55% daripada perlawanannya menentang pemain Pertengahan. Ini menunjukkan bahawa ejen mencapai tahap pemain manusia pertengahan dalam pusingan pingpong.

Sebab mengapa robot tidak dapat mengalahkan pemain lanjutan adalah disebabkan oleh had fizikal dan teknikal, termasuk kelajuan tindak balas, keupayaan penderiaan kamera, pemprosesan putaran, dll., yang sukar untuk dimodelkan dengan tepat dalam persekitaran simulasi.

Robot DeepMind bermain pingpong, dan pukulan depan dan pukulan kilasnya tergelincir ke udara, mengalahkan manusia pemula sepenuhnya

Sparring dengan robot juga sangat menarik

Peserta kajian mengatakan bahawa mereka sangat seronok bermain dengan robot dan memberikan robot rating yang tinggi dari segi "menarik" dan "menarik" . Mereka juga sebulat suara menyatakan bahawa mereka "sangat bersedia" untuk melawan robot itu semula. Semasa masa lapang, mereka bermain dengan robot selama purata 4 minit dan 06 saat selama 5 minit. . Untuk menguji pemerhatian ini, para penyelidik merancang kadar pendaratan robot terhadap putaran bola, dan keputusan menunjukkan bahawa kadar pendaratan robot menurun dengan ketara kerana ia menghadapi lebih banyak bola putaran belakang. Kecacatan ini sebahagiannya disebabkan oleh robot yang cuba mengelak daripada berlanggar dengan meja semasa mengendalikan bola rendah, dan kedua oleh fakta bahawa ia benar-benar sukar untuk menentukan putaran bola dalam masa nyata.

Robot DeepMind bermain pingpong, dan pukulan depan dan pukulan kilasnya tergelincir ke udara, mengalahkan manusia pemula sepenuhnya
Pautan rujukan: Robot DeepMind bermain pingpong, dan pukulan depan dan pukulan kilasnya tergelincir ke udara, mengalahkan manusia pemula sepenuhnya

https://sites.google.com/view/competitive-robot-table-tennis/home?utm_source&utm_medium&utm_campaign&

Atas ialah kandungan terperinci Robot DeepMind bermain pingpong, dan pukulan depan dan pukulan kilasnya tergelincir ke udara, mengalahkan manusia pemula sepenuhnya. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Label berkaitan:
sumber:jiqizhixin.com
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan
Tentang kita Penafian Sitemap
Laman web PHP Cina:Latihan PHP dalam talian kebajikan awam,Bantu pelajar PHP berkembang dengan cepat!