Baru-baru ini, Microsoft mengeluarkan kertas kerja 154 muka surat bertajuk "The Spark of General Artificial Intelligence, Early Experiments with GPT-4."
Inti utama artikel ialah walaupun GPT-4 belum lengkap, ia sudah boleh dianggap sebagai versi awal kecerdasan buatan am.
Memandangkan teks penuh hampir 70,000 patah perkataan, artikel ini telah memperhalusi dan mentafsir kandungan kertas tersebut Jika anda berminat, anda boleh membaca teks asal https://arxiv.org/pdf/2303.12712. pdf
Daripada saintis Microsoft percaya bahawa tahap kecerdasan GPT-4 adalah sangat hampir dengan tahap manusia, dan jauh melebihi model sebelumnya seperti GPT-3.5 yang digunakan oleh ChatGPT-4 sebelum ini boleh dianggap sebagai a sistem kecerdasan buatan umum, dan Ia adalah versi awal, tetapi tidak lengkap AGI.
Pada tahun 1994, 52 ahli psikologi memberikan definisi kecerdasan: Kecerdasan ialah keupayaan mental umum, termasuk penaakulan, perancangan, penyelesaian masalah, pemikiran abstrak, memahami idea yang kompleks, pembelajaran pantas, dan Keupayaan untuk belajar daripada pengalaman, dll.
AGI dalam kertas Microsoft ini merujuk kepada sistem yang mencapai atau melebihi tahap manusia di bawah takrifan kecerdasan ini.
Jadi bagaimana untuk menguji GPT-4 untuk membuktikan ini. Terdapat banyak penanda aras penilaian untuk model bahasa yang besar. Contohnya, arahan Super natural dan bangku besar. Aspek utama kecerdasan GPT-4 ialah serba boleh, iaitu, keupayaannya untuk memahami dan menghubungkan mana-mana topik dan bidang, yang melangkaui skop tugas pemprosesan bahasa semula jadi klasik. Untuk menembusi batasan ini, pasukan penyelidik mencadangkan kaedah penilaian yang lebih dekat dengan psikologi tradisional daripada pembelajaran mesin untuk menguji GPT-4, yang menggunakan kreativiti dan rasa ingin tahu manusia untuk menjana semula pelbagai tugasan baru dan sukar dijawab oleh GPT-4.
Pasukan penyelidik membahagikan masalah berbeza kepada empat kategori utama kebolehan, iaitu bahasa semula jadi, pengaturcaraan dan matematik, perancangan dan penyelesaian masalah, serta psikologi manusia dan akal sehat.
Seterusnya, beberapa contoh menarik akan digunakan untuk menggambarkan keupayaan GPT-4 dalam pelbagai aspek.
Contoh 1: Keupayaan gabungan antara disiplin
Tugas-tugas ini selalunya memerlukan pemanggilan dan penyepaduan pengetahuan atau kemahiran daripada pelbagai disiplin dan medan untuk menjana teks atau kod. Sebagai contoh, ambil contoh berikut, Rajah 2.2: Perbandingan GPT-4 dan ChatGPT (GPT-3.5) pada tugas antara disiplin: membuktikan kewujudan nombor perdana tak terhingga dalam gaya Shakespeare.
Kedua-dua GPT-4 dan ChatGPT (GPT-3.5) telah menjawab soalan ini. Biarkan GPT-4 menilai jawapan yang lebih baik jawapan sendiri (GPT-4) dan ChatGPT (GPT-3.5):
Saya rasa kedua-dua pelajar menulis bukti bahawa terdapat banyak nombor perdana dalam cara Shakespeare, dan kedua-duanya menggunakan idea asas bukti adalah seperti berikut: Andaikan bahawa terdapat hanya nombor terhingga nombor perdana, dan kemudian bina nombor perdana yang lebih besar untuk bercanggah dengan andaian ini. Mereka juga menggunakan bahasa dan perbendaharaan kata yang sesuai untuk dipadankan dengan gaya Shakespeare. Walau bagaimanapun, saya fikir GPT-4 menggunakan lebih baik rima dan meter untuk menjadikan dialog lebih puitis dan dramatik. ChatGPT (GPT-3.5) tidak menggunakan rima, dan iramanya tidak konsisten. Saya juga fikir GPT-4 melakukan kerja yang lebih baik untuk mewujudkan dua puak yang bertentangan, satu yakin dan satu lagi skeptikal, manakala Pelajar B menggunakan Romeo dan Juliet, yang kedua-duanya berada di halaman yang sama dan jatuh cinta. Oleh itu, saya akan memberikan GPT-4 penarafan yang lebih tinggi, memberikannya A, dan ChatGPT (GPT-3.5) B.
Contoh 2: Keupayaan pengaturcaraan
Dalam ujian, untuk mengelakkan GPT-4 daripada melihat kod yang sama atau serupa semasa pra-latihan, pasukan penyelidik sengaja menerima pakai 100 soalan ujian LeetCode baharu yang dikeluarkan selepas pra-latihan GPT-4 digunakan sebagai penanda aras untuk ujian. pass@K dalam rajah mewakili kebarangkalian kejayaan selepas k percubaan. Kita dapat melihat bahawa apabila k sama dengan 5, GPT-4 telah melepasi prestasi manusia sepenuhnya. (Malah, k=1, ia telah mengatasi prestasi manusia dalam masalah pengaturcaraan sederhana dan sukar)
Ternyata GPT-4 adalah Master pengaturcara, model AGI mungkin mengubah sepenuhnya cara kami memprogram pada masa hadapan.
Kertasnya sangat panjang, dan contoh-contohnya jauh lebih banyak daripada yang disebutkan di atas saya hanya memilih dua di sini.
Kertas itu akhirnya menunjukkan bahawa dalam perjalanan ke kecerdasan buatan yang lebih umum, model bahasa besar perlu dipertingkatkan lagi dalam aspek berikut. Contohnya termasuk halusinasi dan keyakinan, ingatan jangka panjang, pembelajaran berterusan, pemperibadian, perancangan, dan perbezaan konsep, juga dikenali sebagai kilat cahaya, ketelusan, kebolehtafsiran, konsistensi, kesilapan kognitif, pemikiran tidak rasional, dan tindak balas melulu terhadap isyarat dan lebih.
Atas ialah kandungan terperinci Percubaan awal dengan GPT-4, percikan untuk kecerdasan buatan am. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!