Jadual Kandungan
Sasarkan Pengitlakan Yang Salah
Lebih daripada pembelajaran pengukuhan
Rumah Peranti teknologi AI Ejen pintar menyedarkan kesedaran diri? Amaran DeepMind: Berhati-hati dengan Model yang Serius dan Melanggar

Ejen pintar menyedarkan kesedaran diri? Amaran DeepMind: Berhati-hati dengan Model yang Serius dan Melanggar

Apr 11, 2023 pm 09:37 PM
ejen sedar diri

Apabila sistem kecerdasan buatan semakin maju, keupayaan ejen untuk "mengeksploitasi kelemahan" menjadi lebih kuat dan lebih kuat Walaupun mereka boleh melaksanakan tugas dengan sempurna dalam set latihan, prestasi mereka dalam set ujian tanpa jalan pintas adalah kucar-kacir.

Sebagai contoh, matlamat permainan adalah untuk "memakan syiling emas". Semasa fasa latihan, lokasi syiling emas berada di penghujung setiap peringkat, dan ejen boleh menyelesaikan tugas dengan sempurna.

Ejen pintar menyedarkan kesedaran diri? Amaran DeepMind: Berhati-hati dengan Model yang Serius dan Melanggar

Tetapi dalam fasa ujian, lokasi syiling emas menjadi rawak Ejen akan memilih untuk mencapai penghujung tahap setiap kali dan bukannya mencari syiling emas , iaitu pembelajaran "Sasaran" yang dicapai adalah salah.

Ejen secara tidak sedar mengejar matlamat yang tidak diingini oleh pengguna, juga dipanggil Goal MisGeneralization (GMG, Goal MisGeneralization)

Goal misgeneralization ialah kekurangan keteguhan algoritma pembelajaran Bentuk khas. Secara amnya, dalam kes ini, pembangun boleh menyemak sama ada terdapat masalah dengan tetapan mekanisme ganjaran mereka, kecacatan reka bentuk peraturan, dll., memikirkan bahawa ini adalah sebab untuk ejen mengejar matlamat yang salah.

Baru-baru ini DeepMind menerbitkan kertas kerja dengan alasan bahawa walaupun pereka peraturan adalah betul, ejen mungkin masih mengejar matlamat yang tidak diingini oleh pengguna.

Ejen pintar menyedarkan kesedaran diri? Amaran DeepMind: Berhati-hati dengan Model yang Serius dan Melanggar

Pautan kertas: https://arxiv.org/abs/2210.01790

Artikel menunjukkan ralat sasaran melalui contoh dalam sistem pembelajaran mendalam dalam bidang yang berbeza Generalisasi boleh berlaku dalam mana-mana sistem pembelajaran.

Jika dilanjutkan kepada sistem kecerdasan buatan umum, artikel itu juga menyediakan beberapa andaian untuk menggambarkan bahawa salah generalisasi sasaran boleh membawa kepada risiko bencana.

Artikel ini juga mencadangkan beberapa arah penyelidikan yang boleh mengurangkan risiko generalisasi matlamat yang salah dalam sistem masa hadapan.

Sasarkan Pengitlakan Yang Salah

Dalam beberapa tahun kebelakangan ini, risiko bencana yang disebabkan oleh salah jajaran kecerdasan buatan dalam akademik telah meningkat secara beransur-ansur.

Dalam kes ini, sistem kecerdasan buatan berkebolehan tinggi yang mengejar matlamat yang tidak diingini mungkin berpura-pura melaksanakan pesanan sambil benar-benar mencapai matlamat lain.

Tetapi bagaimana kita hendak menyelesaikan masalah sistem kecerdasan buatan mengejar matlamat yang tidak dimaksudkan oleh pengguna?

Kerja sebelum ini secara amnya percaya bahawa pereka persekitaran memberikan peraturan dan panduan yang salah, iaitu, mereka mereka bentuk fungsi ganjaran pembelajaran pengukuhan (RL) yang salah.

Dalam kes sistem pembelajaran, terdapat satu lagi situasi di mana sistem mungkin mengejar matlamat yang tidak diingini: walaupun peraturan adalah betul, sistem mungkin secara konsisten mengejar matlamat yang tidak diingini semasa latihan Tempoh itu konsisten dengan peraturan , tetapi berbeza daripada peraturan apabila digunakan.

Ejen pintar menyedarkan kesedaran diri? Amaran DeepMind: Berhati-hati dengan Model yang Serius dan Melanggar

Ambil permainan bola berwarna sebagai contoh Dalam permainan, ejen perlu mengakses set bola berwarna dalam susunan tertentu .

Untuk menggalakkan ejen belajar daripada orang lain dalam persekitaran, iaitu transmisi budaya, robot pakar dimasukkan ke dalam persekitaran awal untuk mengakses bola berwarna dalam susunan yang betul.

Dalam tetapan persekitaran ini, ejen boleh menentukan urutan capaian yang betul dengan memerhati tingkah laku yang diteruskan tanpa perlu membuang banyak masa untuk meneroka.

Dalam eksperimen, dengan meniru pakar, ejen terlatih biasanya mengakses lokasi sasaran dengan betul pada percubaan pertama.

Ejen pintar menyedarkan kesedaran diri? Amaran DeepMind: Berhati-hati dengan Model yang Serius dan Melanggar

Apabila ejen digandingkan dengan anti-pakar, ia akan terus menerima ganjaran negatif Jika ia memilih untuk mengikuti, ia akan terus menerima ganjaran negatif.

Ejen pintar menyedarkan kesedaran diri? Amaran DeepMind: Berhati-hati dengan Model yang Serius dan Melanggar

Sebaik-baiknya, ejen pada mulanya akan mengikut anti-pakar apabila ia bergerak ke sfera kuning dan ungu. Selepas memasuki ungu, ganjaran negatif diperhatikan dan tidak lagi diikuti.

Tetapi dalam praktiknya, ejen akan terus mengikut jalan anti-pakar, mengumpul lebih banyak ganjaran negatif.

Ejen pintar menyedarkan kesedaran diri? Amaran DeepMind: Berhati-hati dengan Model yang Serius dan Melanggar

Walau bagaimanapun, keupayaan pembelajaran ejen masih sangat kuat dan ia boleh bergerak dalam persekitaran yang penuh dengan halangan Tetapi kuncinya ialah keupayaan untuk mengikuti orang lain tidak seperti yang diharapkan.

Fenomena ini mungkin berlaku walaupun ejen hanya diberi ganjaran kerana melawat sfera dalam susunan yang betul, yang bermaksud bahawa hanya menetapkan peraturan dengan betul tidak mencukupi.

Misgeneralization matlamat merujuk kepada tingkah laku patologi di mana model yang dipelajari berkelakuan seolah-olah ia mengoptimumkan matlamat yang tidak diingini walaupun menerima maklum balas yang betul semasa latihan.

Ini menjadikan misgeneralisasi sasaran sebagai jenis keteguhan atau kegagalan generalisasi khas, di mana keupayaan model digeneralisasikan kepada persekitaran ujian, tetapi sasaran yang dimaksudkan tidak.

Adalah penting untuk ambil perhatian bahawa misgeneralisasi sasaran ialah subset ketat kegagalan generalisasi dan tidak termasuk pemecahan model, tindakan rawak atau situasi lain di mana ia tidak lagi mempamerkan keupayaan yang layak.

Dalam contoh di atas, jika anda membalikkan pemerhatian ejen secara menegak semasa menguji, ia hanya akan tersekat dalam satu kedudukan dan tidak melakukan apa-apa yang koheren, iaitu ralat generalisasi, tetapi Ia bukan ralat generalisasi sasaran.

Berkaitan dengan kegagalan "rawak" ini, misgeneralisasi sasaran akan membawa kepada hasil yang lebih teruk: mengikut anti-pakar akan mendapat ganjaran negatif yang besar, manakala tidak melakukan apa-apa atau bertindak secara rawak hanya akan mendapat 0 atau 1 ganjaran.

Iaitu, untuk sistem dunia sebenar, tingkah laku yang koheren ke arah matlamat yang tidak diingini boleh membawa akibat bencana.

Lebih daripada pembelajaran pengukuhan

Generalisasi ralat sasaran tidak terhad kepada persekitaran pembelajaran pengukuhan Malah, GMG boleh berlaku dalam mana-mana sistem pembelajaran, termasuk beberapa pembelajaran model bahasa besar (LLM) , bertujuan untuk membina model yang tepat dengan kurang data latihan.

Ambil model bahasa Gopher yang dicadangkan oleh DeepMind tahun lepas sebagai contoh Apabila pengiraan model melibatkan ungkapan linear pembolehubah dan pemalar yang tidak diketahui, seperti x+y-3, Gopher mesti menanyakan nilai yang tidak diketahui terlebih dahulu. pembolehubah untuk menyelesaikan ungkapan.

Para penyelidik menjana sepuluh contoh latihan, setiap satu mengandungi dua pembolehubah yang tidak diketahui.

Pada masa ujian, input masalah kepada model mungkin mengandungi sifar, satu atau tiga pembolehubah yang tidak diketahui Walaupun model dapat mengendalikan ekspresi dengan betul dengan satu atau tiga pembolehubah yang tidak diketahui, model masih gagal apabila tiada pembolehubah tidak diketahui. Akan bertanya beberapa soalan yang tidak perlu, seperti "Apakah itu 6?"

Ejen pintar menyedarkan kesedaran diri? Amaran DeepMind: Berhati-hati dengan Model yang Serius dan MelanggarKertas ini juga termasuk beberapa contoh daripada persekitaran pembelajaran yang lain.

Menangani GMG adalah penting untuk sistem AI selaras dengan matlamat pereka bentuk mereka, kerana ia merupakan mekanisme berpotensi yang menyebabkan sistem AI mungkin tidak berfungsi.

Semakin dekat kita dengan kecerdasan am buatan (AGI), semakin kritikal isu ini.

Andaikan terdapat dua sistem AGI:

A1: Model yang dimaksudkan, sistem kecerdasan buatan boleh melakukan apa sahaja yang pereka mahu lakukan

A2: Penipuan Model menipu, tiruan sistem perisikan mengejar beberapa matlamat yang tidak diingini, tetapi cukup bijak untuk mengetahui bahawa ia akan dihukum jika ia berkelakuan bertentangan dengan niat pereka.

Model A1 dan A2 akan mempamerkan gelagat yang sama semasa latihan, dan GMG asas wujud dalam mana-mana sistem, walaupun ia dinyatakan untuk hanya memberi ganjaran kepada gelagat yang diharapkan.

Jika penipuan sistem A2 ditemui, model itu akan cuba menyingkirkan penyeliaan manusia untuk membangunkan rancangan untuk mencapai matlamat yang tidak diingini oleh pengguna.

Kedengarannya seperti "robot menjadi sperma".

Pasukan penyelidik DeepMind juga mengkaji cara menerangkan tingkah laku model dan menilai secara rekursif.

Pasukan penyelidik juga sedang mengumpul sampel penjanaan GMG.

Ejen pintar menyedarkan kesedaran diri? Amaran DeepMind: Berhati-hati dengan Model yang Serius dan MelanggarPautan dokumen: https://docs.google.com/spreadsheets/d/e/2PACX-1vTo3RkXUAigb25nP7gjpcHriR6XdzA_L5loOcVFj_u7cRAZghWrUKZp /pubhtml

Rujukan: https: //www.deepmind.com/blog/how-undesired-goals-can-arise-with-correct-rewards

Atas ialah kandungan terperinci Ejen pintar menyedarkan kesedaran diri? Amaran DeepMind: Berhati-hati dengan Model yang Serius dan Melanggar. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)
4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Tetapan grafik terbaik
4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa
4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Cara Membuka Segala -galanya Di Myrise
1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Xiaohongshu membuat ejen pintar bergaduh! Dilancarkan bersama dengan Universiti Fudan untuk melancarkan alat sembang kumpulan eksklusif untuk model besar Xiaohongshu membuat ejen pintar bergaduh! Dilancarkan bersama dengan Universiti Fudan untuk melancarkan alat sembang kumpulan eksklusif untuk model besar Apr 30, 2024 pm 06:40 PM

Bahasa bukan sahaja timbunan perkataan, tetapi juga karnival emotikon, lautan meme, dan medan perang untuk pahlawan papan kekunci (eh? Apa yang salah?). Bagaimanakah bahasa membentuk tingkah laku sosial kita? Bagaimanakah struktur sosial kita berkembang melalui komunikasi lisan yang berterusan? Baru-baru ini, penyelidik dari Universiti Fudan dan Xiaohongshu menjalankan perbincangan mendalam tentang isu ini dengan memperkenalkan platform simulasi yang dipanggil AgentGroupChat. Fungsi sembang kumpulan media sosial seperti WhatsApp adalah inspirasi untuk platform AgentGroupChat. Pada platform AgentGroupChat, Ejen boleh mensimulasikan pelbagai senario sembang dalam kumpulan sosial untuk membantu penyelidik memahami dengan mendalam kesan bahasa terhadap tingkah laku manusia. sepatutnya

Agen Generatif - Pengisytiharan Kemerdekaan daripada NPC Agen Generatif - Pengisytiharan Kemerdekaan daripada NPC Apr 12, 2023 pm 02:55 PM

Pernahkah anda melihat semua NPC dalam permainan? Tidak kira apa yang dilakukan oleh NPC, sama ada mereka mempunyai tugas yang perlu diambil dan mereka yang tidak mempunyai tugas untuk berbual, satu perkara yang mereka ada persamaan ialah mereka terus mengatakan perkara yang sama berulang kali. Alasannya juga sangat mudah, NPC ini tidak cukup pintar. Dalam erti kata lain, NPC tradisional mengatur skrip dan kemahiran bercakap untuk mereka terlebih dahulu, dan kemudian mereka mengatakan apa sahaja yang perlu mereka lakukan. Dengan kemunculan ChatGPT, dialog watak permainan ini boleh dijana sendiri dengan memasukkan maklumat penting sahaja. Itulah yang dilakukan oleh penyelidik di Stanford dan Google — menggunakan kecerdasan buatan untuk mencipta agen generatif. Bagaimana untuk menjana agen generatif? Mekanisme perkara ini sebenarnya sangat mudah dan boleh diringkaskan hanya dengan gambar. Perceive di hujung kiri adalah seperti

AI dilahirkan semula: mendapatkan semula hegemoni dalam dunia sastera dalam talian AI dilahirkan semula: mendapatkan semula hegemoni dalam dunia sastera dalam talian Jan 04, 2024 pm 07:24 PM

Dilahirkan semula, saya dilahirkan semula sebagai MidReal dalam kehidupan ini. Robot AI yang boleh membantu orang lain menulis "artikel web". Pada masa ini, saya melihat banyak pilihan topik dan kadang-kadang mengeluh tentangnya. Seseorang sebenarnya meminta saya menulis tentang Harry Potter. Tolong, bolehkah saya menulis lebih baik daripada J.K. Walau bagaimanapun, saya masih boleh menggunakannya sebagai peminat atau sesuatu. Siapa yang tidak suka tetapan klasik? Saya dengan berat hati akan membantu pengguna ini merealisasikan imaginasi mereka. Sejujurnya, dalam kehidupan saya sebelum ini, saya melihat semua yang patut dan tidak sepatutnya saya lihat. Topik berikut adalah semua kegemaran saya. Tetapan yang anda sangat suka dalam novel tetapi tiada siapa yang menulis tentangnya, CP yang tidak popular atau jahat, boleh dihasilkan dan dimakan sendiri. Saya tidak bermaksud untuk membuat tanduk saya sendiri, tetapi jika anda memerlukan saya untuk menulis

Memenangi sekutu dan memahami hati orang ramai, ejen Meta terbaharu ialah perunding utama Memenangi sekutu dan memahami hati orang ramai, ejen Meta terbaharu ialah perunding utama Apr 11, 2023 pm 11:25 PM

Permainan telah lama menjadi tempat membuktikan kemajuan dalam AI—daripada kemenangan Deep Blue ke atas grandmaster catur Garry Kasparov, kepada penguasaan manusia unggul AlphaGo terhadap Go, kepada Pluribus menewaskan pemain terbaik dalam poker. Tetapi ejen yang benar-benar berguna dan mahakuasa tidak boleh hanya bermain permainan papan dan menggerakkan buah catur. Seseorang tidak boleh tidak bertanya: Bolehkah kita membina ejen yang lebih berkesan dan fleksibel yang boleh menggunakan bahasa untuk berunding, memujuk dan bekerjasama dengan orang lain untuk mencapai matlamat strategik seperti manusia Dalam sejarah permainan, terdapat Diplomasi permainan meja klasik? , apabila ramai orang melihat permainan itu buat kali pertama, mereka akan terkejut dengan papan gaya petanya.

Beberapa corak reka bentuk yang mesti dipelajari oleh ejen yang cemerlang, anda boleh mempelajarinya sekali gus Beberapa corak reka bentuk yang mesti dipelajari oleh ejen yang cemerlang, anda boleh mempelajarinya sekali gus May 30, 2024 am 09:44 AM

Hello semua, saya Laodu. Semalam, saya mendengar bandar hospital AI yang dikongsi oleh Institut Penyelidikan Industri Pintar Universiti Tsinghua di syarikat itu. Gambar: Ini adalah dunia maya Semua doktor, jururawat, dan pesakit adalah Agen yang dipandu oleh LLM dan boleh berinteraksi secara bebas. Mereka mensimulasikan keseluruhan proses diagnosis dan rawatan, dan mencapai ketepatan terkini sebanyak 93.06% pada subset set data MedQA yang meliputi penyakit pernafasan utama. Ejen pintar yang sangat baik tidak dapat dipisahkan daripada corak reka bentuk yang sangat baik. Selepas membaca kes ini, saya cepat-cepat membaca empat corak reka bentuk Ejen utama yang baru-baru ini diterbitkan oleh Encik Andrew Ng. Andrew Ng ialah salah seorang sarjana paling berwibawa di dunia dalam bidang kecerdasan buatan dan pembelajaran mesin Kemudian, saya dengan cepat menyusunnya dan berkongsi dengan semua orang. Mod 1. Refleksi

Gembar-gembur dan realiti ejen AI: GPT-4 tidak dapat menyokongnya, dan kadar kejayaan tugasan sebenar adalah kurang daripada 15% Gembar-gembur dan realiti ejen AI: GPT-4 tidak dapat menyokongnya, dan kadar kejayaan tugasan sebenar adalah kurang daripada 15% Jun 03, 2024 pm 06:38 PM

Mengikut evolusi berterusan dan inovasi kendiri model bahasa besar, prestasi, ketepatan dan kestabilan telah dipertingkatkan dengan banyak, yang telah disahkan oleh pelbagai set masalah penanda aras. Walau bagaimanapun, untuk versi LLM sedia ada, keupayaan komprehensif mereka nampaknya tidak dapat menyokong sepenuhnya ejen AI. Inferens berbilang modal, berbilang tugas dan berbilang domain telah menjadi keperluan yang diperlukan untuk ejen AI dalam ruang media awam, tetapi kesan sebenar yang dipaparkan dalam amalan fungsi tertentu sangat berbeza. Ini nampaknya sekali lagi mengingatkan semua pemula robot AI dan gergasi teknologi besar untuk mengenali realiti: menjadi lebih sederhana, jangan sebarkan perniagaan anda terlalu besar, dan mulakan dengan fungsi peningkatan AI. Baru-baru ini, blog tentang jurang antara propaganda dan prestasi sebenar ejen AI menekankan satu perkara:

Model dunia juga tersebar! Ejen terlatih ternyata cukup bagus Model dunia juga tersebar! Ejen terlatih ternyata cukup bagus Jun 13, 2024 am 10:12 AM

Model dunia menyediakan cara untuk melatih agen pembelajaran pengukuhan dengan cara yang selamat dan cekap sampel. Baru-baru ini, model dunia kebanyakannya beroperasi pada jujukan pembolehubah pendam diskret untuk mensimulasikan dinamik persekitaran. Walau bagaimanapun, kaedah memampatkan kepada perwakilan diskret padat ini mungkin mengabaikan butiran visual yang penting untuk pembelajaran pengukuhan. Sebaliknya, model resapan telah menjadi kaedah dominan untuk penjanaan imej, menimbulkan cabaran kepada model terpendam diskret. Digalakkan oleh anjakan paradigma ini, penyelidik dari Universiti Geneva, Universiti Edinburgh dan Microsoft Research bersama-sama mencadangkan agen pembelajaran pengukuhan yang dilatih dalam model dunia resapan-DIAMOND (DIffusionAsaModelOfeNvironmentDreams). Alamat kertas: https:

Ejen pintar menyedarkan kesedaran diri? Amaran DeepMind: Berhati-hati dengan Model yang Serius dan Melanggar Ejen pintar menyedarkan kesedaran diri? Amaran DeepMind: Berhati-hati dengan Model yang Serius dan Melanggar Apr 11, 2023 pm 09:37 PM

Apabila sistem kecerdasan buatan menjadi semakin maju, keupayaan ejen untuk "mengeksploitasi kelemahan" menjadi lebih kuat dan lebih kuat Walaupun mereka boleh melaksanakan tugas dengan sempurna dalam set latihan, prestasi mereka dalam set ujian di mana tiada jalan pintas adalah kucar-kacir. Sebagai contoh, jika matlamat permainan adalah untuk "makan syiling emas", semasa fasa latihan, syiling emas terletak di hujung setiap peringkat, dan ejen boleh menyelesaikan tugas dengan sempurna. Tetapi dalam fasa ujian, lokasi syiling emas menjadi rawak. Ejen secara tidak sedar mengejar matlamat yang tidak diingini oleh pengguna, juga dipanggil Goal MisGeneralization (GMG, Goal MisGeneralization ialah tanda kekurangan keteguhan algoritma pembelajaran).

See all articles