Andrej Karpathy, pengasas bersama OpenAI, baru-baru ini memberikan ucapan ringkas pada acara pembangun, bercakap tentang pandangan dalaman beliau dan OpenAI tentang Ejen AI (ejen kecerdasan buatan).
Andrej Karpathy membandingkan kesukaran dalam membangunkan Ejen AI pada masa lalu dengan peluang baharu yang dibangunkan dengan alatan teknologi baharu Dia juga bergurau bahawa kerjanya di Tesla "terganggu oleh pemanduan autonomi dan VR adalah contoh Ejen AI yang buruk.
Berkenaan peluang baharu, Andrej Karpathy percaya bahawa sekarang adalah masa untuk kembali ke neurosains semula dan mencari inspirasi daripadanya - sama seperti yang berlaku pada zaman awal pembelajaran mendalam.
Sebaliknya, Andrej Karpathy percaya bahawa orang biasa, usahawan dan pakar mempunyai lebih banyak kelebihan berbanding syarikat seperti OpenAI dalam membina Ejen AI.
Beliau juga mendedahkan bahawa jika kertas kerja mencadangkan kaedah latihan yang berbeza, Slack dalaman OpenAI akan mencemuhnya, memikirkan bahawa mereka hanya bermain yang lain. Mereka akan membincangkan kertas kerja Agen AI terkini dengan penuh minat.
Berikut ialah teks penuh perkongsian ini:
Salam semua.
Saya telah dijemput untuk memberikan beberapa kata-kata motivasi mengenai topik Ejen AI. Saya rasa Ejen AI sangat rapat dengan saya dalam satu cara Biar saya mulakan dengan cerita Ini adalah kisah OpenAI yang sangat awal Pada masa itu, OpenAI hanya mempunyai sedozen orang, pada masa itu sebenarnya Ejen RL (ejen pembelajaran pengukuhan).
Semua orang benar-benar berminat untuk membina ejen, tetapi pada masa itu kebanyakannya berdasarkan permainan, keterujaan adalah di sekitar syarikat permainan seperti Atari, dan projek saya di OpenAI pada masa itu cuba membawa tumpuan Ejen RL kepada menggunakan papan kekunci Dan gunakan tetikus pada komputer, bukan permainan.
Saya ingin menjadikannya lebih berguna dan melakukan banyak kerja, projek ini dipanggil World of Bits.
Saya dan beberapa rakan sekerja akhirnya menerbitkan kertas kerja. Kertas kerja ini tidak menakjubkan kerana ia pada asasnya berdasarkan kaedah pembelajaran pengukuhan RL. Halaman web kami sangat mudah, membolehkan pengguna menempah penerbangan atau memesan makanan dengan mudah.
Semua ini jelas tidak akan berfungsi kerana teknologi belum sedia dan adalah tidak bijak untuk melakukan perkara ini pada masa itu.
Nampaknya kita harus melupakan sepenuhnya Ejen AI dan melakukan model bahasa.
Kami kembali ke sini lima tahun kemudian, dan saya sedikit terganggu oleh pemanduan autonomi, tetapi kini Ejen AI kembali keren dan kotak alat kami berbeza sama sekali, dan cara kami menangani masalah ini berbeza sama sekali.
Sebenarnya, anda semua telah membuat kajian tentang ejen AI, tetapi mungkin tidak dengan kaedah pembelajaran pengukuhan. Ia gila dan saya tidak fikir kita dapat meramalkan perkara ini pada masa itu. Ini sangat menyeronokkan.
Izinkan saya meluangkan sedikit masa untuk bercakap tentang sebab Ejen AI begitu popular. Saya rasa jelas kepada ramai orang bahawa AGI (Kecerdasan Am Buatan) akan memanfaatkan sepenuhnya keupayaan Ejen AI, bukan hanya seorang, tetapi banyak. Mungkin akan ada organisasi atau tamadun entiti digital, yang saya fikir sangat memberi inspirasi dan juga sedikit gila.
Namun, saya juga ingin menuangkan air sejuk ke atas ini. Pada pendapat saya, terdapat kelas masalah yang mudah dibayangkan dan ditunjukkan dalam fikiran anda, tetapi sangat sukar untuk diubah menjadi produk sebenar. Banyak perkara termasuk dalam kategori ini, saya rasa pemanduan autonomi adalah contohnya.
Mudah untuk membayangkan pemanduan autonomi dan membina kereta demo untuk memandu di sekitar blok, tetapi ia mengambil masa sepuluh tahun untuk menjadikannya produk. Dengan cara yang sama, saya fikir perkara yang sama berlaku untuk VR, ia akan mengambil masa sepuluh tahun untuk menjadikannya berfungsi.
Saya rasa perkara yang sama berlaku untuk Ejen AI sedikit sebanyak. Walaupun mudah untuk teruja membayangkannya, saya percaya ia akan mengambil masa sedekad penglibatan untuk benar-benar menjadikannya berkesan.
Perkara lain yang ingin saya katakan ialah, saya rasa menarik sekarang untuk kembali kepada sains saraf dan dalam beberapa cara mendapat inspirasi daripadanya lagi, peringkat awal pembelajaran mendalam telah diilhamkan oleh sains saraf.
Sangat menarik untuk memikirkan tentang hubungan antara mereka, terutamanya kerana saya fikir ramai orang melihat model bahasa sebagai sebahagian daripada penyelesaian, tetapi bagaimanakah anda membina entiti digital lengkap yang mempunyai semua keupayaan kognitif manusia?
Tidak dinafikan bahawa kita semua bersetuju bahawa kita memerlukan sistem asas untuk merancang, memikirkan dan merenung aktiviti yang kita lakukan, dan di sinilah neurosains memainkan peranan penting.
Sebagai contoh, hippocampus adalah sangat penting Apakah dalam AI Ejen memainkan peranan hippocampus untuk melaksanakan fungsi seperti penyimpanan ingatan, capaian semula, dll.?
Kami mempunyai pemahaman awal tentang cara membina korteks visual dan pendengaran, tetapi masih terdapat banyak perkara yang tidak diketahui dalam Ejen AI.
Sebagai contoh, apakah rupa permainan visual dalam Ejen AI? Apakah yang dimaksudkan dengan talamus, tempat duduk minda bawah sedar, dalam Agen AI?
Ini sangat menarik. Saya sebenarnya membawa buku neurosains bersama saya hari ini, Brain and Behavior oleh David Eagleman, yang saya dapati sangat menarik dan mencerahkan.
Mungkin sekarang kita harus melihat kepada neurosains untuk mendapatkan inspirasi menarik dan mereka bentuk semula neuron individu, seperti yang kita lakukan sebelum ini.
Akhirnya saya nak akhiri dengan kata-kata semangat. Perkara yang menarik tetapi tidak jelas ialah Agen AI yang anda (merujuk kepada penonton) yang dibina sebenarnya berada di barisan hadapan keupayaan Ejen AI kontemporari Semua institusi LLM yang besar seperti OpenAI, DeFi, dll., saya mengesyaki mereka tidak di barisan hadapan.
Anda berada di tahap canggih.
Sebagai contoh, OpenAI sangat baik dalam melatih model bahasa besar Transformer. Jika kertas kerja mencadangkan beberapa kaedah latihan yang berbeza, maka perbincangan dalam kumpulan OpenAI Slack dalaman kami adalah seperti, oh ya, seseorang mencubanya dua setengah tahun lalu, dan ia tidak berjaya, dan kami tidak tahu tentang ini kaedah. Saya tahu selok beloknya.
Tetapi apabila kertas Ejen AI baharu keluar, kami semua sangat berminat dan berpendapat ia sangat hebat, kerana pasukan kami tidak menghabiskan masa lima tahun untuk itu, kami tidak tahu apa-apa lebih daripada anda, kami bekerjasama dengan anda Semua orang bersaing bersama.
Inilah sebabnya saya fikir anda berada di barisan hadapan keupayaan Ejen AI, yang sangat penting untuk pembangunan Ejen AI.
Atas ialah kandungan terperinci Perkongsian terbaru OpenAI master Karpathy: Mengapa OpenAI paling berminat dengan Ejen AI. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!