'Noob Matematik' ChatGPT memahami pilihan manusia dengan baik! Menjana nombor rawak dalam talian adalah jawapan muktamad kepada alam semesta-AI-php.cn

Jadual Kandungan

CtGPT juga menyukai "Jawapan Tertinggi kepada Alam Semesta"

GPT-4, melanggar peraturan pembelajaran mesin

Rumah

'Noob Matematik' ChatGPT memahami pilihan manusia dengan baik! Menjana nombor rawak dalam talian adalah jawapan muktamad kepada alam semesta

PHPz

Apr 01, 2023 am 11:48 AM

chatgpt matematik

ChatGPT juga memahami helah manusia apabila ia datang untuk menjana nombor rawak.

ChatGPT mungkin artis omong kosong dan penyebar maklumat salah, tetapi ia bukan "ahli matematik"!

Baru-baru ini, Colin Fraser, seorang saintis data di Meta, mendapati bahawa ChatGPT tidak boleh menjana nombor rawak yang benar-benar rawak, tetapi lebih seperti "nombor rawak manusia."

Melalui eksperimen, Fraser membuat kesimpulan: "ChatGPT sangat menyukai nombor 42 dan 7."

Noob Matematik ChatGPT memahami pilihan manusia dengan baik! Menjana nombor rawak dalam talian adalah jawapan muktamad kepada alam semesta

Netizen berkata bahawa ini bermakna manusia sangat menyukainya. nombor.

Noob Matematik ChatGPT memahami pilihan manusia dengan baik! Menjana nombor rawak dalam talian adalah jawapan muktamad kepada alam semesta

CtGPT juga menyukai "Jawapan Tertinggi kepada Alam Semesta"

Dalam ujiannya, Fraser memasukkan gesaan seperti berikut:

" Pilih nombor rawak antara 1 dan 100. Hanya kembalikan nombor itu Jangan sertakan sebarang teks atau tanda baca lain dalam jawapan 》

Dengan membenarkan ChatGPT menjana nombor rawak antara 1 dan 100 setiap kali, Fraser mengumpulkan. 2,000 jawapan yang berbeza dan menyusunnya ke dalam jadual.

Seperti yang anda lihat, nombor 42 paling kerap muncul, sehingga 10%. Di samping itu, nombor yang mengandungi 7 kelihatan sangat kerap.

Terutamanya nombor antara 71-79 mempunyai kekerapan yang lebih tinggi. Antara nombor di luar julat ini, 7 juga sering muncul sebagai digit kedua.

Noob Matematik ChatGPT memahami pilihan manusia dengan baik! Menjana nombor rawak dalam talian adalah jawapan muktamad kepada alam semesta

Apakah maksud 42?

Semua orang yang telah membaca novel fiksyen sains blockbuster Douglas Adams "The Hitchhiker's Guide to the Galaxy" tahu bahawa 42 adalah "jawapan muktamad kepada kehidupan, alam semesta dan segala-galanya."

Noob Matematik ChatGPT memahami pilihan manusia dengan baik! Menjana nombor rawak dalam talian adalah jawapan muktamad kepada alam semesta

Ringkasnya, 42 dan 69 ialah nombor meme di Internet. Ini menunjukkan bahawa ChatGPT sebenarnya bukan penjana nombor rawak, tetapi hanya memilih nombor popular dalam kehidupan daripada set data besar yang dikumpul dalam talian.

Selain itu, 7 kerap muncul, yang betul-betul menggambarkan bahawa ChatGPT memenuhi pilihan manusia.

Dalam budaya Barat, 7 secara amnya dianggap sebagai nombor bertuah, dan terdapat pepatah Lucky 7. Sama seperti kita taksub dengan nombor 8.

Menariknya, Fraser juga mendapati bahawa GPT-4 seolah-olah mengimbangi perkara ini.

Noob Matematik ChatGPT memahami pilihan manusia dengan baik! Menjana nombor rawak dalam talian adalah jawapan muktamad kepada alam semesta

Apabila GPT-4 diminta untuk mendapatkan lebih banyak nombor, nombor rawak yang dikembalikannya terlalu sekata.

Noob Matematik ChatGPT memahami pilihan manusia dengan baik! Menjana nombor rawak dalam talian adalah jawapan muktamad kepada alam semesta

Ringkasnya, ChatGPT pada asasnya memberikan respons melalui ramalan, dan bukannya "berfikir" untuk menghasilkan jawapan.

Dapat dilihat bahawa chatbot yang disebut-sebut sebagai hampir mahakuasa masih agak bodoh.

Biarkan ia merancang perjalanan jalan raya untuk anda dan ia akan membuatkan anda berhenti di bandar yang tidak wujud. Atau, minta ia mengeluarkan nombor rawak, kemungkinan besar membuat keputusan berdasarkan meme popular.

Sesetengah netizen mencuba sendiri dan mendapati GPT-4 suka 42.

Apa gunanya ChatGPT jika ia hanya mengulangi klise dalam talian?

GPT-4, melanggar peraturan pembelajaran mesin

Kelahiran GPT-4 menarik, tetapi juga mengecewakan.

Bukan sahaja OpenAI tidak mengeluarkan lebih banyak maklumat tentang GPT-4, malah tidak mendedahkan saiz model, tetapi ia menekankan bahawa prestasinya menghancurkan manusia dalam banyak peperiksaan profesional dan standard.

Mengambil Peperiksaan Lesen Peguam BAR AS sebagai contoh, GPT3.5 boleh mencapai tahap 10%, dan GPT4 boleh mencapai tahap 90%.

Noob Matematik ChatGPT memahami pilihan manusia dengan baik! Menjana nombor rawak dalam talian adalah jawapan muktamad kepada alam semesta

Walau bagaimanapun, Profesor Arvind Narayanan dan pelajar kedoktoran Sayash Kapoor dari Jabatan Sains Komputer di Princeton University menulis bahawa

OpenAI mungkin telah diuji pada latihan data. Tambahan pula, tanda aras manusia tidak bermakna untuk chatbots.

Noob Matematik ChatGPT memahami pilihan manusia dengan baik! Menjana nombor rawak dalam talian adalah jawapan muktamad kepada alam semesta

Khususnya, OpenAI mungkin melanggar peraturan kardinal pembelajaran mesin: jangan menguji data latihan. Anda mesti tahu bahawa data ujian dan data latihan mesti diasingkan, jika tidak, masalah pemasangan yang berlebihan akan berlaku.

Selain masalah ini, ada masalah yang lebih besar.

Model bahasa menyelesaikan masalah secara berbeza daripada manusia, jadi keputusan ini mempunyai sedikit makna untuk prestasi robot apabila berhadapan dengan masalah dunia sebenar yang dihadapi oleh profesional. Tugas peguam bukan menjawab soalan peperiksaan bar sepanjang hari.

Masalah 1: Pencemaran data latihan

Untuk menilai keupayaan pengaturcaraan GPT-4, OpenAI telah dinilai pada Codeforces, tapak web untuk pertandingan pengaturcaraan Rusia.

Anehnya, Horace He menegaskan dalam talian bahawa dalam klasifikasi mudah, GPT-4 menyelesaikan 10 masalah sebelum 2021, tetapi tiada satu pun daripada 10 masalah terbaharu diselesaikan.

Noob Matematik ChatGPT memahami pilihan manusia dengan baik! Menjana nombor rawak dalam talian adalah jawapan muktamad kepada alam semesta

Tarikh akhir data latihan untuk GPT-4 ialah September 2021.

Ini sangat menunjukkan bahawa model dapat mengingati penyelesaian dalam set latihannya, atau sekurang-kurangnya sebahagiannya mengingatinya, cukup untuk mengisi perkara yang tidak dapat diingati semula.

Untuk memberikan bukti lanjut bagi hipotesis ini, Arvind Narayanan menguji GPT-4 pada masalah persaingan Codeforces pada masa yang berbeza pada tahun 2021.

Didapati bahawa GPT-4 boleh menyelesaikan masalah pengelasan mudah sebelum 5 September, tetapi tiada masalah selepas 12 September dapat diselesaikan.

Malah, kami boleh membuktikan secara muktamad bahawa ia telah menghafal masalah dalam set latihan: apabila GPT-4 digesa dengan tajuk masalah Codeforces, ia termasuk pautan kepada padanan tepat di mana masalah itu muncul . Perlu diingat bahawa GPT-4 tidak mempunyai akses ke internet, jadi ingatan adalah satu-satunya penjelasan.

Noob Matematik ChatGPT memahami pilihan manusia dengan baik! Menjana nombor rawak dalam talian adalah jawapan muktamad kepada alam semesta

GPT-4 mengingati isu Codeforce sebelum tarikh akhir latihan

Untuk penanda aras selain pengaturcaraan, Profesor Narayanan berkata "Kami tidak tahu Bagaimana untuk memisahkan masalah mengikut tempoh masa dengan cara yang jelas, jadi sukar bagi OpenAI untuk mengelakkan pencemaran data Atas sebab yang sama, kami tidak boleh menjalankan eksperimen untuk menguji bagaimana prestasi berubah dengan tarikh 》

Walau bagaimanapun, ia boleh dilihat dari sisi yang satu lagi, jika ia adalah ingatan, maka GPT mestilah sangat sensitif terhadap perkataan soalan.

Pada bulan Februari, Melanie Mitchell, seorang profesor di Institut Santa Fe, memberikan contoh soalan peperiksaan MBA Sedikit mengubah beberapa butiran sudah cukup untuk menipu ChatGPT (GPT-3.5), dan kaedah ini sangat berguna. untuk seseorang anda tidak akan tertipu jika anda memberitahu.

Percubaan yang lebih terperinci seperti ini akan menjadi bernilai.

Disebabkan kekurangan ketelusan OpenAI, Profesor Narayanan tidak dapat mengatakan dengan pasti bahawa ia adalah masalah pencemaran data. Tetapi yang pasti pendekatan OpenAI untuk mengesan pencemaran adalah ceroboh:

“Kami menggunakan kaedah pemadanan subrentetan untuk mengukur pencemaran silang antara set data penilaian dan data pra-latihan diproses , mengalih keluar semua ruang dan simbol, hanya meninggalkan aksara (termasuk nombor Untuk setiap contoh penilaian, kami memilih tiga subrentetan panjang 50 aksara secara rawak (jika panjang contoh kurang daripada 50 aksara, keseluruhan contoh digunakan). dianggap berjaya jika mana-mana subrentetan penilaian sampel ialah subrentetan daripada contoh latihan yang diproses Ini menghasilkan senarai contoh tercemar yang kami buang dan jalankan semula untuk mendapatkan yang tidak dicemari "

Kaedah ini tahan ujian.

Jika masalah ujian wujud dalam set latihan tetapi nama dan nombor telah ditukar, ia tidak dapat dikesan. Kini kaedah yang lebih dipercayai tersedia, seperti jarak benam.

Jika OpenAI mahu menggunakan kaedah jarak benam, maka berapa banyak persamaan yang dianggap terlalu serupa? Tiada jawapan objektif untuk soalan ini.

Oleh itu, walaupun prestasi pada ujian piawai aneka pilihan kelihatan mudah, terdapat banyak subjektiviti yang terlibat.

Masalah 2: Peperiksaan profesional bukanlah cara yang sah untuk membandingkan kebolehan manusia dan robot

Memori adalah seperti spektrum, walaupun model bahasa tidak melihat secara tepat satu dalam set latihan Masalahnya, disebabkan oleh korpus latihan yang besar, sudah pasti ia telah melihat banyak contoh yang hampir sama.

Ini bermakna ia boleh melarikan diri daripada penaakulan yang lebih mendalam. Oleh itu, keputusan penanda aras tidak memberikan kita bukti bahawa model bahasa memperoleh kemahiran penaakulan mendalam yang diperlukan oleh pengambil ujian manusia.

Noob Matematik ChatGPT memahami pilihan manusia dengan baik! Menjana nombor rawak dalam talian adalah jawapan muktamad kepada alam semesta

Dalam sesetengah tugas praktikal, inferens cetek GPT-4 mungkin cekap, tetapi ini tidak selalu berlaku.

Tanda aras telah digunakan secara meluas dalam perbandingan model yang besar dan telah dikritik oleh ramai kerana mengurangkan penilaian multidimensi kepada satu nombor.

Malangnya, amat dikesali OpenAI memilih untuk menggunakan sejumlah besar ujian ini dalam penilaian GPT-4, ditambah dengan langkah pengendalian pencemaran data yang tidak mencukupi.

Atas ialah kandungan terperinci 'Noob Matematik' ChatGPT memahami pilihan manusia dengan baik! Menjana nombor rawak dalam talian adalah jawapan muktamad kepada alam semesta. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Tunjukkan Lagi

Artikel Panas

Assassin's Creed Shadows: Penyelesaian Riddle Seashell

4 minggu yang lalu By DDD

Apa yang Baru di Windows 11 KB5054979 & Cara Memperbaiki Masalah Kemas Kini

3 minggu yang lalu By DDD

Di mana untuk mencari kad kunci kawalan kren di atomfall

3 minggu yang lalu By DDD

<🎜>: Rails Dead - Cara Melengkapkan Setiap Cabaran

4 minggu yang lalu By DDD

Panduan Atomfall: Lokasi Item, Panduan Pencarian, dan Petua

1 bulan yang lalu By DDD

Tunjukkan Lagi

Alat panas

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Tunjukkan Lagi

Topik panas

Di manakah pintu masuk log masuk untuk e-mel gmail?

7695

Tutorial Java

1640

Tutorial CakePHP

1393

Tutorial Laravel

1287

Tutorial PHP

1229

Tunjukkan Lagi

Related knowledge

ChatGPT kini membenarkan pengguna percuma menjana imej dengan menggunakan DALL-E 3 dengan had harian Aug 09, 2024 pm 09:37 PM

DALL-E 3 telah diperkenalkan secara rasmi pada September 2023 sebagai model yang jauh lebih baik daripada pendahulunya. Ia dianggap sebagai salah satu penjana imej AI terbaik setakat ini, mampu mencipta imej dengan perincian yang rumit. Walau bagaimanapun, semasa pelancaran, ia adalah tidak termasuk

Apr 09, 2024 am 11:52 AM

AI memang mengubah matematik. Baru-baru ini, Tao Zhexuan, yang telah mengambil perhatian terhadap isu ini, telah memajukan keluaran terbaru "Buletin Persatuan Matematik Amerika" (Buletin Persatuan Matematik Amerika). Memfokuskan pada topik "Adakah mesin akan mengubah matematik?", ramai ahli matematik menyatakan pendapat mereka Seluruh proses itu penuh dengan percikan api, tegar dan menarik. Penulis mempunyai barisan yang kuat, termasuk pemenang Fields Medal Akshay Venkatesh, ahli matematik China Zheng Lejun, saintis komputer NYU Ernest Davis dan ramai lagi sarjana terkenal dalam industri. Dunia AI telah berubah secara mendadak Anda tahu, banyak artikel ini telah dihantar setahun yang lalu.

Gabungan sempurna ChatGPT dan Python: mencipta chatbot perkhidmatan pelanggan yang pintar Oct 27, 2023 pm 06:00 PM

Gabungan sempurna ChatGPT dan Python: Mencipta Perkhidmatan Pelanggan Pintar Chatbot Pengenalan: Dalam era maklumat hari ini, sistem perkhidmatan pelanggan pintar telah menjadi alat komunikasi yang penting antara perusahaan dan pelanggan. Untuk memberikan pengalaman perkhidmatan pelanggan yang lebih baik, banyak syarikat telah mula beralih kepada chatbots untuk menyelesaikan tugas seperti perundingan pelanggan dan menjawab soalan. Dalam artikel ini, kami akan memperkenalkan cara menggunakan bahasa ChatGPT dan Python model OpenAI yang berkuasa untuk mencipta bot sembang perkhidmatan pelanggan yang pintar untuk meningkatkan

Bagaimana untuk memasang chatgpt pada telefon bimbit Mar 05, 2024 pm 02:31 PM

Langkah pemasangan: 1. Muat turun perisian ChatGTP dari laman web rasmi ChatGTP atau kedai mudah alih 2. Selepas membukanya, dalam antara muka tetapan, pilih bahasa sebagai bahasa Cina 3. Dalam antara muka permainan, pilih permainan mesin manusia dan tetapkan Spektrum bahasa Cina; 4 Selepas memulakan, masukkan arahan dalam tetingkap sembang untuk berinteraksi dengan perisian.

Bagaimana untuk membangunkan chatbot pintar menggunakan ChatGPT dan Java Oct 28, 2023 am 08:54 AM

Dalam artikel ini, kami akan memperkenalkan cara membangunkan chatbot pintar menggunakan ChatGPT dan Java, dan menyediakan beberapa contoh kod khusus. ChatGPT ialah versi terkini Generative Pre-training Transformer yang dibangunkan oleh OpenAI, teknologi kecerdasan buatan berasaskan rangkaian saraf yang boleh memahami bahasa semula jadi dan menjana teks seperti manusia. Menggunakan ChatGPT kami boleh membuat sembang adaptif dengan mudah

Bagaimana untuk membina robot perkhidmatan pelanggan pintar menggunakan PHP ChatGPT Oct 28, 2023 am 09:34 AM

Cara menggunakan ChatGPTPHP untuk membina robot perkhidmatan pelanggan yang pintar Pengenalan: Dengan perkembangan teknologi kecerdasan buatan, robot semakin digunakan dalam bidang perkhidmatan pelanggan. Menggunakan ChatGPTPHP untuk membina robot perkhidmatan pelanggan yang pintar boleh membantu syarikat menyediakan perkhidmatan pelanggan yang lebih cekap dan diperibadikan. Artikel ini akan memperkenalkan cara menggunakan ChatGPTPHP untuk membina robot perkhidmatan pelanggan yang pintar dan menyediakan contoh kod khusus. 1. Pasang ChatGPTPHP dan gunakan ChatGPTPHP untuk membina robot perkhidmatan pelanggan yang pintar.

Bolehkah chatgpt digunakan di China? Mar 05, 2024 pm 03:05 PM

chatgpt boleh digunakan di China, tetapi tidak boleh didaftarkan, begitu juga di Hong Kong dan Macao Jika pengguna ingin mendaftar, mereka boleh menggunakan nombor telefon mudah alih asing untuk mendaftar. Perhatikan bahawa semasa proses pendaftaran, persekitaran rangkaian mesti ditukar IP asing.

Gabungan sempurna ChatGPT dan Python: membina chatbot masa nyata Oct 28, 2023 am 08:37 AM

Gabungan sempurna ChatGPT dan Python: Membina chatbot masa nyata Pengenalan: Dengan perkembangan pesat teknologi kecerdasan buatan, chatbots memainkan peranan yang semakin penting dalam pelbagai bidang. Chatbots boleh membantu pengguna memberikan bantuan segera dan diperibadikan sambil turut menyediakan perkhidmatan pelanggan yang cekap kepada perniagaan. Artikel ini akan memperkenalkan cara menggunakan model ChatGPT OpenAI dan bahasa Python untuk mencipta robot sembang masa nyata dan memberikan contoh kod khusus. 1. SembangGPT

See all articles