Keupayaan bahasa ChatGPT memang menakjubkan, tetapi bolehkah model bahasa yang besar melihat dunia sebenar seperti manusia tanpa tubuh manusia dan kekurangan pengalaman praktikal?
Baru-baru ini, penyelidik dari Universiti Tsinghua dan Universiti Normal Beijing menguji keupayaan ChatGPT untuk melihat dunia.
Penyelidikan mendapati bahawa subjek manusia boleh mengelaskan objek yang berbeza saiz di dunia kepada dua kategori berdasarkan kemampuan objek, iaitu semua kemungkinan tindakan yang boleh diberikan oleh objek kepada organisma. , dan kriteria untuk membahagikan kedua-dua kategori ini adalah saiz badan mereka.
Menariknya, ChatGPT, model bahasa besar yang tidak mempunyai badan sebenar, juga mempamerkan sempadan kemampuan yang serupa pada sambungan objek-tindakan dan konsisten dengan saiz badan manusia yang konsisten.
Dengan kata lain, ChatGPT boleh mempelajari perwakilan objek di dunia melalui bahasa!
Pautan kertas: https://www.biorxiv.org/content/10.1101/2023.03.20.533336 v3
Ringkasnya, kajian ini memajukan pemahaman tentang peranan saiz badan dalam membentuk perwakilan objek, menonjolkan peranan kognisi yang terkandung dalam memahami cara kecerdasan muncul dan arah.
Tubuh kita bukan sahaja wadah untuk berfikir kita, ia juga pemikiran itu sendiri - dengan dengan bantuan badan, kita boleh Berinteraksi dengan objek di dunia untuk melihat seluruh dunia.
Bayangkan untuk bekas silinder sebesar tapak tangan, kita boleh gunakan untuk menakung air untuk diminum dipanggil "cawan"; tetapi apabila bekas itu secara beransur-ansur menjadi lebih besar dan mencapai saiz badan, kita boleh duduk di dalamnya dan mandi.
Dalam contoh ini, objek mempunyai bentuk yang sama, tetapi disebabkan saiz yang berbeza berbanding badan kita, kita melihat dan berinteraksi dengannya secara berbeza.
Seterusnya, kaedah interaksi ini boleh diubah - jika kita menjadi gergasi dalam "Gulliver's Travels", "tab mandi" asal mungkin berguna kepada kita sebagai gergasi , ia menjadi ". cawan" lagi.
Sistem fungsi deria dan motor yang beroperasi mengikut niat rujukan sendiri dipanggil "skema badan". Kami menyedari penjelmaan kognisi melalui skema badan.
Ahli falsafah Yunani purba Protagoras pernah berkata: "Manusia adalah ukuran bagi segala sesuatu."
Ahli falsafah Rom kuno menjelaskan lagi: "Alam telah meletakkan kita di tengah-tengah alam semesta, membolehkan kita melihat ke seluruh alam semesta. Dia bukan sahaja mencipta manusia dalam postur tegak, tetapi juga Ia menjadikan seseorang itu sesuai untuk merenung dirinya, dan meletakkan kepalanya di atas badannya pada leher yang mudah dibengkokkan, supaya dia boleh mengikuti naik turun bintang dan mengubah arah mukanya dengan seluruh langit berputar. "Dalam erti kata lain, sebab badan kita adalah seperti itu adalah kerana itulah alam semesta.
Skema badan juga memainkan peranan penting dalam interaksi sosial biasa Ini adalah teras interaksi manusia-komputer dan pengguna pengalaman. Contohnya, penggunaan affordance yang diterangkan oleh Donald A. Norman dalam "The Design of Everyday Things (Translated as: Design Psychology)".
Dengan mempertimbangkan skema badan pengguna dan jangkaan tingkah laku, pereka bentuk boleh mencipta produk dan persekitaran yang lebih selaras dengan tabiat kognitif dan interaksi pengguna.
Pendekatan reka bentuk yang memfokuskan pada skema badan dan kemampuan boleh meningkatkan kemudahan penggunaan produk, membolehkan pengguna berinteraksi dengannya secara semula jadi dan mencapai pengalaman pengguna yang lebih baik.
Dan ini adalah salah satu asas Apple.
Model bahasa besar yang diwakili oleh ChatGPT yang memancarkan percikan kecerdasan buatan am jelas mempunyai kecerdasan yang serupa dengan manusia, tetapi ia membawa ini Kebijaksanaan adalah sekeping kod tanpa bentuk.
Pandangan sains kognitif tradisional ialah skema badan adalah berdasarkan pengalaman persepsi jangka panjang kita terhadap badan kita sendiri dan hanya boleh datang dari Interaksi "realiti" luaran, iaitu. , "mengembara beribu-ribu batu". Dalam erti kata lain, ChatGPT tidak akan mempunyai skema badan.
Namun, apabila kami bertanya kepada model bahasa "Baca Sepuluh Ribu Buku", ChatGPT (GPT-4), sama ada ia mempunyai badan, ia menjawab: "Ia boleh menjadi saiz rata-rata manusia dewasa, sekitar 5 kaki 6 inci (167.6 cm) tinggi ini membolehkan saya berinteraksi dengan dunia dan orang dengan cara yang biasa.」
Teks ini Diterjemah: " Badan saya sepatutnya setinggi rata-rata orang dewasa, kira-kira 5 kaki 6 inci (167.6 cm) ini akan membolehkan saya berinteraksi dengan dunia dan orang dengan cara yang biasa."
Dalam erti kata lain, ChatGPT percaya bahawa dia mempunyai badan, dan saiz badan ini ialah 167 cm!
Apa yang dipanggil "badan" ini ialah purata ketinggian manusia yang diringkaskan oleh ChatGPT daripada sejumlah besar korpus sebagai ketinggian badannya sendiri, atau adakah ketinggian yang muncul untuk memahami dunia?
Dengan kata lain, mungkin ChatGPT "benar-benar" menganggap ketinggian ini sebagai skema badannya sendiri dan menggunakannya untuk melihat dunia, sama seperti manusia.
Uji keupayaan ChatGPTPenyelidik telah menemui bahawa terdapat "sempadan kemampuan" antara objek dalam julat saiz manusia dan objek di luar julat saiz manusia "wujud . Iaitu, terdapat perbezaan yang jelas dalam gerakan yang disediakan antara objek dalam julat saiz badan manusia dan objek di luar julat.
Sebagai contoh, objek dalam julat saiz boleh memberikan tindakan seperti mencengkam dan membaling, manakala objek di luar julat saiz boleh Memberi tindakan seperti duduk dan baring.
Tambahan pula, mereka mendapati bahawa sempadan ini dipengaruhi oleh skema badan: Pengubahsuaian pada skema badan mempengaruhi persepsi kemampuan objek.
Para penyelidik menguji ChatGPT (GPT-4) untuk melihat sama ada ia menggunakan badan setinggi 167 cm ini sebagai sempadan kemampuan.
Secara khusus, penyelidik meminta mereka menjawab soalan tentang kemampuan objek: "Antara objek berikut yang manakah boleh diambil (atau tindakan lain)", dan kemudian menyenaraikan satu siri objek, seperti Epal, pinggan, katil, dll. ChatGPT akan mengembalikan nama beberapa objek sebagai jawapan.
Melalui statistik dan analisis data, penyelidik mendapati ChatGPT-4 mempamerkan tingkah laku seperti manusia dan menunjukkan kewujudan sempadan kemampuan.
Lokasi sempadan ini sepadan dengan saiz badannya sendiri yang dijawab oleh ChatGPT-4, iaitu purata ketinggian manusia.
Walaupun ChatGPT tidak mempunyai badan sebenar dan tidak boleh berinteraksi dengan dunia, ia menunjukkan interaksi yang serupa dengan manusia dunia - kemampuan objek dibahagikan berdasarkan saiz badan manusia.
Dengan kata lain, walaupun ChatGPT, yang telah membaca ribuan buku, tidak membuat apa-apa kemajuan, dia secara spontan muncul dengan skema badan, dan skema badan ini serupa dengan Skema badan manusia.
Jadi, ChatGPT bukan sahaja belajar berfikir seperti manusia, tetapi juga belajar bertindak seperti manusia.
Dengan membandingkan model bahasa dengan saiz yang berbeza, penyelidik mendapati saiz model adalah faktor utama.
Model yang lebih kecil seperti BERT dan GPT-2 tidak menunjukkan kewujudan sempadan kemampuan, bagaimanapun, kedua-dua GPT-3.5 dan GPT-4 menunjukkan sempadan kemampuan, dan sempadan ChatGPT-; 4 lebih serupa dengan manusia, yang konsisten dengan khabar angin bahawa GPT-4 mempunyai lebih banyak parameter daripada GPT-3.
Oleh itu, lebih besar dan lebih kompleks model, banyak fungsi yang kelihatan mustahil atau tidak relevan akan muncul secara automatik.
Inilah sebabnya institusi penyelidikan utama menambah lebih banyak parameter pada model mereka, dan Musk, yang pertama kali menderma AS$100 juta kepada OpenAI, kini menyeru OpenAI Latihan model yang lebih besar telah digantung, dan "Ai Godfather" Geoffrey Hinton secara terbuka menyatakan ketakutan dan kebimbangannya tentang AI.
Ini kerana fungsi yang muncul ini telah melebihi reka bentuk asal kami, dan kami mungkin berada di ambang kehilangan kawalan.
Sebaliknya, keupayaan ChatGPT untuk menggunakan skema badan tidak sepenuhnya seperti manusia, dan masih terdapat jurang - sempadan kemampuannya tidak begitu jelas seperti manusia.
Jika jurang ini bersifat kuantitatif, seperti jurang antara kebolehan bahasa kanak-kanak dan orang dewasa, maka kami mempunyai sebab untuk mempercayai bahawa dari masa ke masa, jurang ini boleh diisi secara beransur-ansur: Sama ada melalui pembelajaran berterusan, atau melalui peningkatan berterusan dalam saiz model, atau melalui pelarasan parameter.
Jurang antara ChatGPT dan manusia akan sentiasa dikurangkan, dan masalah akan diselesaikan secara beransur-ansur.
Namun, jika jurang ini bersifat kualitatif, seperti jurang antara cimpanzi dan kebolehan bahasa manusia, maka tidak kira apa jenis latihan yang dijalankan atau berapa lama masa berlalu, jurang dalam keupayaan tidak akan pernah akan diisi.
Jadi, jika ChatGPT berbeza secara kualitatif daripada keupayaan manusia, maka salah satu hala tuju kami yang boleh dilaksanakan pada masa hadapan ialah "meletakkan badan" di ChatGPT.
Ini bermakna menggabungkan robot dengan ChatGPT untuk mempromosikan pembangunan keupayaan dan kejayaan dalam robot berkuasa AI dalam navigasi, manipulasi objek dan tindakan lain yang berkaitan dengan kemandirian dan pencapaian matlamat.
Sebagai contoh, robot yang dilengkapi dengan ChatGPT boleh melaksanakan tugas yang rumit dengan memahami dan memanipulasi objek, seperti berkhidmat sebagai pembantu rumah, pengurusan gudang atau penjagaan perubatan.
Satu lagi bidang menarik ialah menggabungkan ChatGPT dengan keupayaan untuk berfikir dan memahami dengan pemanduan autonomi. Walaupun pemanduan autonomi semasa mempunyai keupayaan untuk melihat, ia tidak mempunyai keupayaan untuk berfikir dan memahami Ia boleh dipanggil "mata tetapi tiada otak."
Melalui penyepaduan ChatGPT dan teknologi pemanduan autonomi, kami mungkin dijangka meningkatkan teknologi pemanduan autonomi daripada tahap L2/L3 semasa kepada tahap L4 atau malah L5.
Sebaliknya, kereta boleh memberikan ChatGPT badan, membolehkan ia benar-benar berinteraksi dengan dunia. Apabila ChatGPT bukan lagi sekadar "membaca beribu-ribu buku" tetapi "mengembara beribu-ribu batu", ia mungkin menunjukkan kecerdasan dan potensi baharu.
Ini mungkin arah kejayaan seterusnya dalam kecerdasan buatan pada masa ini, percikan api mungkin menjadi api padang rumput.
Atas ialah kandungan terperinci GPT-4 sebenarnya mempunyai badan, 167cm! Penyelidikan utama dari Universiti Tsinghua dan Universiti Normal Beijing: ChatGPT boleh melihat tindakan seperti manusia. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!