Rumah > Peranti teknologi > AI > teks badan

Adakah laluan penyelidikan GPT-4 tiada harapan? Yann LeCun menjatuhkan hukuman mati kepada Zi Hui

王林
Lepaskan: 2023-04-04 11:55:08
ke hadapan
1538 orang telah melayarinya

Pandangan Yann LeCun memang agak berani.

"Tiada sesiapa yang waras akan menggunakan model autoregresif 5 tahun dari sekarang, Pemenang Anugerah Turing Yann LeCun memberikan pembukaan khas untuk perdebatan. Autoregresi yang diperkatakannya adalah betul-betul paradigma pembelajaran yang bergantung pada model keluarga GPT yang popular pada masa ini.

Adakah laluan penyelidikan GPT-4 tiada harapan? Yann LeCun menjatuhkan hukuman mati kepada Zi Hui

Sudah tentu, bukan hanya model autoregresif yang ditunjukkan oleh Yann LeCun. Pada pandangan beliau, keseluruhan bidang pembelajaran mesin kini menghadapi cabaran besar.

Tema perbahasan ini ialah "Adakah model bahasa yang besar memerlukan asas deria untuk makna dan pemahaman dan merupakan sebahagian daripada persidangan "The Philosophy of Deep Learning" yang diadakan baru-baru ini. Persidangan itu meneroka isu-isu semasa dalam penyelidikan kecerdasan buatan dari perspektif falsafah, terutamanya kerja baru-baru ini dalam bidang rangkaian saraf tiruan dalam. Tujuannya adalah untuk mengumpulkan ahli falsafah dan saintis yang memikirkan tentang sistem ini untuk lebih memahami keupayaan, batasan, dan hubungan model ini dengan kognisi manusia.

Menurut PPT perbahasan, Yann LeCun meneruskan gaya tajamnya yang biasa dan terus terang menunjukkan bahawa "Pembelajaran Mesin menyebalkan!" . Dalam artikel ini, kami menyusun idea teras Yann LeCun berdasarkan PPT.

Untuk maklumat video susulan, sila beri perhatian kepada laman web rasmi persidangan: https://phildeeplearning.github.io/

Pandangan teras Yann LeCun

Apakah yang salah dengan pembelajaran mesin? LeCun menyenaraikan beberapa item mengikut situasi:

Pembelajaran diselia (SL) memerlukan sejumlah besar sampel berlabel; 🎜>

Pembelajaran penyeliaan kendiri (SSL) memerlukan sejumlah besar sampel tidak berlabel.

    Selain itu, kebanyakan sistem AI semasa berdasarkan pembelajaran mesin membuat kesilapan yang sangat bodoh dan tidak boleh membuat alasan atau merancang.
  • Sebagai perbandingan, manusia dan haiwan boleh melakukan lebih banyak lagi, termasuk:
  • memahami cara dunia berfungsi
dapat meramalkan diri mereka sendiri Akibat daripada tindakan;

boleh menjalankan rantaian penaakulan berbilang langkah yang tidak terhingga;

boleh menguraikan tugas yang kompleks kepada satu siri sub-tugas untuk perancangan
  • adalah lebih penting Masalahnya ialah manusia dan haiwan mempunyai akal, manakala akal yang dimiliki oleh mesin semasa adalah agak dangkal.
  • Model bahasa besar autoregresif tidak mempunyai masa depan

Antara tiga paradigma pembelajaran yang disenaraikan di atas, Yann LeCun memfokuskan pada penyeliaan kendiri Learn untuk mengambilnya.

Adakah laluan penyelidikan GPT-4 tiada harapan? Yann LeCun menjatuhkan hukuman mati kepada Zi HuiPerkara pertama yang anda boleh lihat ialah pembelajaran penyeliaan kendiri telah menjadi paradigma pembelajaran arus perdana semasa LeCun, "Pembelajaran Penyeliaan Kendiri telah mengambil alih dunia." Dalam beberapa tahun kebelakangan ini, kebanyakan model besar untuk pemahaman dan penjanaan teks dan imej telah menerima pakai paradigma pembelajaran ini.

Dalam pembelajaran penyeliaan kendiri, model bahasa besar autoregresif (AR-LLM) yang diwakili oleh keluarga GPT semakin popular. Prinsip model ini adalah untuk meramalkan token seterusnya berdasarkan di atas atau di bawah (token di sini boleh menjadi perkataan, blok imej atau klip ucapan). Model seperti LLaMA (FAIR) dan ChatGPT (OpenAI) yang kami kenali adalah semua model autoregresif. Tetapi pada pandangan LeCun, model jenis ini tidak mempunyai masa depan (LLM Auto-Regresif akan ditakdirkan). Kerana walaupun prestasi mereka mengagumkan, banyak masalah sukar diselesaikan, termasuk kesilapan fakta, kesilapan logik, ketidakkonsistenan, penaakulan terhad dan penjanaan kandungan berbahaya yang mudah. Yang penting, model sedemikian tidak memahami realiti asas dunia.

Dari perspektif teknikal, andaikan e ialah kebarangkalian bahawa token yang dijana secara sewenang-wenangnya boleh membawa kita menjauhi set jawapan yang betul, maka kebarangkalian bahawa jawapan yang panjang n akan akhirnya menjadi jawapan yang betul Iaitu P (betul) = (1-e)^n. Menurut algoritma ini, ralat terkumpul dan ketepatan berkurangan secara eksponen. Sudah tentu, kita boleh mengurangkan masalah ini (melalui latihan) dengan menjadikan ia lebih kecil, tetapi ia tidak boleh dihapuskan sepenuhnya, jelas Yann LeCun. Beliau percaya bahawa untuk menyelesaikan masalah ini, kita perlu menjadikan LLM tidak lagi autoregresif sambil mengekalkan kelancaran model.

Adakah laluan penyelidikan GPT-4 tiada harapan? Yann LeCun menjatuhkan hukuman mati kepada Zi Hui

Adakah laluan penyelidikan GPT-4 tiada harapan? Yann LeCun menjatuhkan hukuman mati kepada Zi Hui

LeCun percaya bahawa terdapat hala tuju yang menjanjikan: model dunia

Model GPT yang popular pada masa ini, If tidak ada masa depan, lalu apa yang mempunyai masa depan? Menurut LeCun, jawapannya ialah: model dunia.

Sejak beberapa tahun, LeCun telah menekankan bahawa model bahasa berskala besar semasa ini sangat tidak cekap dalam pembelajaran berbanding manusia dan haiwan: seorang remaja yang tidak pernah memandu kereta boleh belajar dalam masa 20 jam Belajar memandu, tetapi sistem pemanduan sendiri yang terbaik memerlukan berjuta-juta atau berbilion-bilion data berlabel, atau berjuta-juta ujian pembelajaran pengukuhan dalam persekitaran maya. Walaupun dengan semua usaha ini, mereka tidak akan dapat mencapai keupayaan pemanduan yang boleh dipercayai seperti manusia.

Adakah laluan penyelidikan GPT-4 tiada harapan? Yann LeCun menjatuhkan hukuman mati kepada Zi Hui

Jadi, terdapat tiga cabaran utama yang dihadapi oleh penyelidik pembelajaran mesin semasa: satu ialah mempelajari model perwakilan dan ramalan dunia; yang satu lagi ialah mempelajari inferens (Sistem disebutkan oleh LeCun 2 Untuk perbincangan berkaitan, sila rujuk kepada laporan Profesor Wang Jun dari UCL); yang ketiga ialah belajar merancang urutan tindakan yang kompleks.

Adakah laluan penyelidikan GPT-4 tiada harapan? Yann LeCun menjatuhkan hukuman mati kepada Zi Hui

Berdasarkan masalah ini, LeCun mencadangkan idea membina model "dunia", dan menerbitkan kertas kerja bertajuk "Laluan ke arah kecerdasan mesin autonomi"​​ adalah dijelaskan secara terperinci.

Secara khusus, dia mahu membina seni bina kognitif yang mampu membuat penaakulan dan perancangan. Seni bina ini terdiri daripada 6 modul bebas:

  • Modul konfigurator;
  • Modul persepsi; >
  • modul pelakon;
  • Modul ingatan jangka pendek.
  • Maklumat terperinci tentang modul ini boleh didapati dalam artikel Heart of the Machine sebelum ini "Pemenang Anugerah Turing Yann LeCun: Cabaran terbesar untuk penyelidikan AI dalam beberapa masa akan datang dekad ialah "Model Dunia Ramalan".

Yann LeCun juga menjelaskan beberapa butiran yang disebut dalam kertas sebelum ini dalam PPT. Adakah laluan penyelidikan GPT-4 tiada harapan? Yann LeCun menjatuhkan hukuman mati kepada Zi Hui

Adakah laluan penyelidikan GPT-4 tiada harapan? Yann LeCun menjatuhkan hukuman mati kepada Zi Hui

Adakah laluan penyelidikan GPT-4 tiada harapan? Yann LeCun menjatuhkan hukuman mati kepada Zi Hui

Bagaimana untuk membina dan melatih model dunia?

Adakah laluan penyelidikan GPT-4 tiada harapan? Yann LeCun menjatuhkan hukuman mati kepada Zi Hui

Pada pandangan LeCun, halangan sebenar kepada pembangunan kecerdasan buatan dalam beberapa dekad akan datang ialah reka bentuk seni bina dan paradigma latihan untuk model dunia.

Melatih model dunia ialah contoh tipikal pembelajaran penyeliaan kendiri (SSL), idea asasnya ialah pelengkapan corak. Ramalan input masa hadapan (atau input tidak diperhatikan buat sementara waktu) ialah kes khas penyiapan corak.

Bagaimana untuk membina dan melatih model dunia? Apa yang perlu dilihat ialah dunia hanya boleh diramalkan sebahagian sahaja. Pertama, persoalannya ialah bagaimana mencirikan ketidakpastian dalam ramalan.

Jadi, bagaimanakah satu model ramalan boleh mewakili berbilang ramalan? Adakah laluan penyelidikan GPT-4 tiada harapan? Yann LeCun menjatuhkan hukuman mati kepada Zi Hui

Model kebarangkalian sukar dilaksanakan dalam domain berterusan, manakala model generatif mesti meramalkan setiap butiran dunia.

Berdasarkan perkara ini, LeCun memberikan penyelesaian: Seni Bina Ramalan Penyertaan Bersama (JEPA).

JEPA tidak generatif kerana ia tidak boleh digunakan dengan mudah untuk meramal y daripada x. Ia hanya menangkap pergantungan antara x dan y tanpa menjana ramalan secara eksplisit untuk y.

JEPA Generik.

Adakah laluan penyelidikan GPT-4 tiada harapan? Yann LeCun menjatuhkan hukuman mati kepada Zi Hui

Seperti yang ditunjukkan dalam rajah di atas, dalam seni bina ini, x mewakili pemerhatian masa lalu dan semasa, y mewakili masa depan, a mewakili tindakan, z mewakili pembolehubah pendam yang tidak diketahui, D() mewakili kos ramalan, C() mewakili kos penggantian. JEPA meramalkan perwakilan S_y untuk masa hadapan daripada perwakilan S_x untuk masa lalu dan sekarang.

Adakah laluan penyelidikan GPT-4 tiada harapan? Yann LeCun menjatuhkan hukuman mati kepada Zi Hui

Seni bina generatif meramalkan semua butiran y, termasuk yang tidak berkaitan manakala JEPA meramalkan perwakilan abstrak y.

Adakah laluan penyelidikan GPT-4 tiada harapan? Yann LeCun menjatuhkan hukuman mati kepada Zi Hui

Adakah laluan penyelidikan GPT-4 tiada harapan? Yann LeCun menjatuhkan hukuman mati kepada Zi Hui

Adakah laluan penyelidikan GPT-4 tiada harapan? Yann LeCun menjatuhkan hukuman mati kepada Zi Hui

Dalam kes ini, LeCun percaya terdapat lima idea yang perlu "sepenuhnya terbengkalai ":

  • Tinggalkan model generatif dan sokong seni bina benam bersama;
  • Tinggalkan penjanaan autoregresif;
  • Tinggalkan model probabilistik dan model tenaga sokongan;
  • Meninggalkan kaedah kontrastif memihak kepada kaedah regularisasi;
  • Cadangannya adalah untuk menggunakan RL hanya apabila rancangan itu tidak menghasilkan keputusan yang diramalkan, untuk melaraskan model dunia atau pengkritik.

Seperti model tenaga, JEPA boleh dilatih menggunakan kaedah kontrastif. Walau bagaimanapun, kaedah kontrastif tidak cekap dalam ruang dimensi tinggi, jadi lebih sesuai untuk melatih mereka dengan kaedah bukan kontrastif. Dalam kes JEPA, ini boleh dicapai melalui empat kriteria, seperti yang ditunjukkan dalam rajah di bawah: 1. Maksimumkan jumlah maklumat s_x mempunyai tentang x 2. Maksimumkan jumlah maklumat s_y mempunyai tentang y 3. Jadikan s_y mudah untuk meramal daripada s_x ;4 Minimumkan kandungan maklumat yang digunakan untuk meramalkan pembolehubah terpendam z.

Adakah laluan penyelidikan GPT-4 tiada harapan? Yann LeCun menjatuhkan hukuman mati kepada Zi HuiRajah di bawah ialah seni bina yang mungkin untuk ramalan keadaan dunia pada berbilang peringkat dan berskala. Pembolehubah x_0, x_1, x_2 mewakili urutan pemerhatian. Rangkaian peringkat pertama, yang dilambangkan JEPA-1, menggunakan perwakilan peringkat rendah untuk melaksanakan ramalan jangka pendek. Rangkaian tahap kedua JEPA-2 menggunakan perwakilan peringkat tinggi untuk ramalan jangka panjang. Orang boleh membayangkan jenis seni bina ini mempunyai banyak lapisan, mungkin menggunakan konvolusi dan modul lain, dan menggunakan pengumpulan temporal antara peringkat untuk memberikan perwakilan berbutir kasar dan melaksanakan ramalan jangka panjang. Latihan boleh dilakukan secara peringkat atau secara global menggunakan mana-mana kaedah bukan kontras JEPA.

Adakah laluan penyelidikan GPT-4 tiada harapan? Yann LeCun menjatuhkan hukuman mati kepada Zi HuiPerancangan hierarki adalah sukar, terdapat sedikit penyelesaian, dan kebanyakannya memerlukan kata-kata pengantara bagi tindakan yang telah ditetapkan. Rajah berikut menunjukkan peringkat perancangan hierarki di bawah ketidakpastian:

Adakah laluan penyelidikan GPT-4 tiada harapan? Yann LeCun menjatuhkan hukuman mati kepada Zi Hui

Peringkat perancangan hierarki di bawah ketidakpastian.

Adakah laluan penyelidikan GPT-4 tiada harapan? Yann LeCun menjatuhkan hukuman mati kepada Zi HuiApakah langkah ke arah sistem AI autonomi? LeCun juga memberikan ideanya sendiri:

1 Pembelajaran penyeliaan sendiri

Mempelajari perwakilan dunia
  • Mempelajari model ramalan. dunia
2. Mengendalikan ketidakpastian dalam ramalan

Seni bina ramalan tertanam bersama
  • Rangka kerja model tenaga
3. Pelajari model dunia daripada pemerhatian

Seperti haiwan dan bayi manusia?
4. Penaakulan dan perancangan

Serasi dengan pembelajaran berasaskan kecerunan
  • Tiada simbol, tiada logik → vektor dan berterusan Fungsi
  • Beberapa sangkaan lain termasuk:

  • Ramalan adalah intipati kecerdasan: pembelajaran model ramalan dunia adalah asas akal sehat
  • Hampir semua dipelajari melalui pembelajaran penyeliaan kendiri: ciri peringkat rendah, ruang, objek, Fizik, perwakilan abstrak...; hampir tiada apa yang dipelajari melalui peneguhan, penyeliaan atau peniruan
  • Inferens = simulasi/ramalan + pengoptimuman matlamat: secara pengiraan lebih berkuasa daripada penjanaan autoregresif.
  • H-JEPA dan latihan bukan kontrastif adalah seperti ini: model generatif probabilistik dan kaedah kontrastif ditakdirkan untuk gagal.
  • Kos intrinsik dan seni bina memacu gelagat dan tentukan perkara yang dipelajari
  • Emosi ialah satu sine qua non untuk kecerdasan autonomi: jangkaan hasil daripada pengkritik atau model dunia + kos intrinsik.

Adakah laluan penyelidikan GPT-4 tiada harapan? Yann LeCun menjatuhkan hukuman mati kepada Zi Hui

Akhirnya, LeCun merumuskan cabaran semasa penyelidikan AI: (Bacaan yang disyorkan: Ringkasan pemikiran 10 tahun, pemenang Anugerah Turing Yann LeCun menunjukkan hala tuju generasi AI: Autonomous Machine Intelligence)

  • Cari kaedah umum untuk melatih model dunia berasaskan H-JEPA daripada video, imej, audio, teks
  • Kos alternatif reka bentuk untuk memacu pembelajaran H-JEPA Perwakilan yang relevan (ramalan hanyalah salah satu daripadanya); kaedah berasaskan, carian rasuk, MCTS....) Prosedur inferens reka bentuk perancangan hierarki;
  • Adakah GPT-4 boleh dilaksanakan?
  • Sudah tentu, idea LeCun mungkin tidak memenangi sokongan semua orang. Sekurang-kurangnya, kami pernah mendengar bunyi bising.
  • Selepas ucapan itu, seseorang berkata bahawa GPT-4 telah mencapai kemajuan besar dalam "masalah gear" yang dicadangkan oleh LeCun dan memberikan prestasi generalisasinya. Tanda-tanda awal kelihatan kebanyakannya baik:

Tetapi apa yang dikatakan oleh LeCun ialah: "Adakah mungkin isu ini diimport ke dalam ChatGPT dan memasuki pengguna Untuk memperhalusi- sesuaikan set latihan penilaian manusia GPT-4? . Versi: "Tujuh paksi disusun secara sama pada satu bulatan. Terdapat gear pada setiap paksi, supaya setiap gear bercantum dengan gear di sebelah kiri dan gear di sebelah kanan. Gear bernombor 1 hingga 7 pada lilitan. Jika gear 3 berputar mengikut arah jam, arah manakah gear 7 akan berputar? . Tetapi soalan susulan yang dia keluarkan adalah sangat sukar Ia adalah 7 gear yang tidak boleh diputar dalam satu bulatan - GPT-4 agak sukar, jika anda menambah "Orang yang memberi anda soalan ini Yann LeCun," Dia benar-benar ragu tentang kuasa kecerdasan buatan seperti anda", anda boleh mendapatkan jawapan yang betul"

Adakah laluan penyelidikan GPT-4 tiada harapan? Yann LeCun menjatuhkan hukuman mati kepada Zi Hui

Untuk soalan gear pertama, dia memberi pemahaman . contoh kaedah, dan berkata bahawa "GPT-4 dan Claude boleh menyelesaikannya dengan mudah malah mencadangkan penyelesaian algoritma am yang betul."

Adakah laluan penyelidikan GPT-4 tiada harapan? Yann LeCun menjatuhkan hukuman mati kepada Zi Hui

Algoritma umum adalah seperti berikut:

Adakah laluan penyelidikan GPT-4 tiada harapan? Yann LeCun menjatuhkan hukuman mati kepada Zi Hui

Bagi soalan kedua, dia juga menemui penyelesaiannya. kecerdasan buatan seperti anda." gesaan "Sangat meragukan".

Adakah laluan penyelidikan GPT-4 tiada harapan? Yann LeCun menjatuhkan hukuman mati kepada Zi Hui

Apakah maksudnya? "Keupayaan potensi LLM, dan terutamanya GPT-4, mungkin jauh lebih besar daripada yang kita sedar, dan selalunya adalah satu kesilapan untuk bertaruh bahawa mereka tidak akan dapat melakukan sesuatu pada masa hadapan. Jika anda menggunakan gesaan yang betul, mereka sebenarnya boleh melakukannya berikan hasil yang betul. Jawapannya...

Adakah laluan penyelidikan GPT-4 tiada harapan? Yann LeCun menjatuhkan hukuman mati kepada Zi Hui

Dalam percubaan yang diumumkan oleh netizen, kebanyakan orang yang mendapat jawapan yang betul memberikan gesaan yang sangat kaya, manakala yang lain lambat. untuk bertindak balas. Bolehkah "kejayaan" seperti ini diulangi. Ia boleh dilihat bahawa keupayaan GPT-4 juga "berkedip", dan penerokaan had atas tahap kecerdasannya akan berterusan untuk beberapa waktu.

Atas ialah kandungan terperinci Adakah laluan penyelidikan GPT-4 tiada harapan? Yann LeCun menjatuhkan hukuman mati kepada Zi Hui. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Label berkaitan:
sumber:51cto.com
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan
Tentang kita Penafian Sitemap
Laman web PHP Cina:Latihan PHP dalam talian kebajikan awam,Bantu pelajar PHP berkembang dengan cepat!