Percubaan awal dengan GPT-4, percikan untuk kecerdasan buatan am-AI-php.cn

Rumah

Peranti teknologi

Percubaan awal dengan GPT-4, percikan untuk kecerdasan buatan am

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Apr 07, 2023 pm 08:01 PM

bahasa gpt-4 Model

Baru-baru ini, Microsoft mengeluarkan kertas kerja 154 muka surat bertajuk "The Spark of General Artificial Intelligence, Early Experiments with GPT-4."

Inti utama artikel ialah walaupun GPT-4 belum lengkap, ia sudah boleh dianggap sebagai versi awal kecerdasan buatan am.

Memandangkan teks penuh hampir 70,000 patah perkataan, artikel ini telah memperhalusi dan mentafsir kandungan kertas tersebut Jika anda berminat, anda boleh membaca teks asal https://arxiv.org/pdf/2303.12712. pdf

Daripada saintis Microsoft percaya bahawa tahap kecerdasan GPT-4 adalah sangat hampir dengan tahap manusia, dan jauh melebihi model sebelumnya seperti GPT-3.5 yang digunakan oleh ChatGPT-4 sebelum ini boleh dianggap sebagai a sistem kecerdasan buatan umum, dan Ia adalah versi awal, tetapi tidak lengkap AGI.

Pada tahun 1994, 52 ahli psikologi memberikan definisi kecerdasan: Kecerdasan ialah keupayaan mental umum, termasuk penaakulan, perancangan, penyelesaian masalah, pemikiran abstrak, memahami idea yang kompleks, pembelajaran pantas, dan Keupayaan untuk belajar daripada pengalaman, dll.

AGI dalam kertas Microsoft ini merujuk kepada sistem yang mencapai atau melebihi tahap manusia di bawah takrifan kecerdasan ini.

Jadi bagaimana untuk menguji GPT-4 untuk membuktikan ini. Terdapat banyak penanda aras penilaian untuk model bahasa yang besar. Contohnya, arahan Super natural dan bangku besar. Aspek utama kecerdasan GPT-4 ialah serba boleh, iaitu, keupayaannya untuk memahami dan menghubungkan mana-mana topik dan bidang, yang melangkaui skop tugas pemprosesan bahasa semula jadi klasik. Untuk menembusi batasan ini, pasukan penyelidik mencadangkan kaedah penilaian yang lebih dekat dengan psikologi tradisional daripada pembelajaran mesin untuk menguji GPT-4, yang menggunakan kreativiti dan rasa ingin tahu manusia untuk menjana semula pelbagai tugasan baru dan sukar dijawab oleh GPT-4.

Pasukan penyelidik membahagikan masalah berbeza kepada empat kategori utama kebolehan, iaitu bahasa semula jadi, pengaturcaraan dan matematik, perancangan dan penyelesaian masalah, serta psikologi manusia dan akal sehat.

Seterusnya, beberapa contoh menarik akan digunakan untuk menggambarkan keupayaan GPT-4 dalam pelbagai aspek.

Contoh 1: Keupayaan gabungan antara disiplin

Tugas-tugas ini selalunya memerlukan pemanggilan dan penyepaduan pengetahuan atau kemahiran daripada pelbagai disiplin dan medan untuk menjana teks atau kod. Sebagai contoh, ambil contoh berikut, Rajah 2.2: Perbandingan GPT-4 dan ChatGPT (GPT-3.5) pada tugas antara disiplin: membuktikan kewujudan nombor perdana tak terhingga dalam gaya Shakespeare.

Percubaan awal dengan GPT-4, percikan untuk kecerdasan buatan am

Kedua-dua GPT-4 dan ChatGPT (GPT-3.5) telah menjawab soalan ini. Biarkan GPT-4 menilai jawapan yang lebih baik jawapan sendiri (GPT-4) dan ChatGPT (GPT-3.5):

Saya rasa kedua-dua pelajar menulis bukti bahawa terdapat banyak nombor perdana dalam cara Shakespeare, dan kedua-duanya menggunakan idea asas bukti adalah seperti berikut: Andaikan bahawa terdapat hanya nombor terhingga nombor perdana, dan kemudian bina nombor perdana yang lebih besar untuk bercanggah dengan andaian ini. Mereka juga menggunakan bahasa dan perbendaharaan kata yang sesuai untuk dipadankan dengan gaya Shakespeare. Walau bagaimanapun, saya fikir GPT-4 menggunakan lebih baik rima dan meter untuk menjadikan dialog lebih puitis dan dramatik. ChatGPT (GPT-3.5) tidak menggunakan rima, dan iramanya tidak konsisten. Saya juga fikir GPT-4 melakukan kerja yang lebih baik untuk mewujudkan dua puak yang bertentangan, satu yakin dan satu lagi skeptikal, manakala Pelajar B menggunakan Romeo dan Juliet, yang kedua-duanya berada di halaman yang sama dan jatuh cinta. Oleh itu, saya akan memberikan GPT-4 penarafan yang lebih tinggi, memberikannya A, dan ChatGPT (GPT-3.5) B.

Contoh 2: Keupayaan pengaturcaraan

Dalam ujian, untuk mengelakkan GPT-4 daripada melihat kod yang sama atau serupa semasa pra-latihan, pasukan penyelidik sengaja menerima pakai 100 soalan ujian LeetCode baharu yang dikeluarkan selepas pra-latihan GPT-4 digunakan sebagai penanda aras untuk ujian. pass@K dalam rajah mewakili kebarangkalian kejayaan selepas k percubaan. Kita dapat melihat bahawa apabila k sama dengan 5, GPT-4 telah melepasi prestasi manusia sepenuhnya. (Malah, k=1, ia telah mengatasi prestasi manusia dalam masalah pengaturcaraan sederhana dan sukar)

Percubaan awal dengan GPT-4, percikan untuk kecerdasan buatan am

Ternyata GPT-4 adalah Master pengaturcara, model AGI mungkin mengubah sepenuhnya cara kami memprogram pada masa hadapan.

Kertasnya sangat panjang, dan contoh-contohnya jauh lebih banyak daripada yang disebutkan di atas saya hanya memilih dua di sini.

Kertas itu akhirnya menunjukkan bahawa dalam perjalanan ke kecerdasan buatan yang lebih umum, model bahasa besar perlu dipertingkatkan lagi dalam aspek berikut. Contohnya termasuk halusinasi dan keyakinan, ingatan jangka panjang, pembelajaran berterusan, pemperibadian, perancangan, dan perbezaan konsep, juga dikenali sebagai kilat cahaya, ketelusan, kebolehtafsiran, konsistensi, kesilapan kognitif, pemikiran tidak rasional, dan tindak balas melulu terhadap isyarat dan lebih.

Atas ialah kandungan terperinci Percubaan awal dengan GPT-4, percikan untuk kecerdasan buatan am. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

Menjana ai hentai secara percuma.

Tunjukkan Lagi

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)

1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Tetapan grafik terbaik

1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Penyelesaian Riddle Seashell

2 minggu yang lalu By DDD

R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa

1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Arahan sembang dan cara menggunakannya

1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Tunjukkan Lagi

Alat panas

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Tunjukkan Lagi

Topik panas

Di manakah pintu masuk log masuk untuk e-mel gmail?

7529

Tutorial CakePHP

1378

Apakah format nama akaun stim

kunci pengaktifan win11 kekal

Sambungan NYT menunjukkan dan jawapan

Tunjukkan Lagi

Related knowledge

Model MoE sumber terbuka paling berkuasa di dunia ada di sini, dengan keupayaan bahasa Cina setanding dengan GPT-4, dan harganya hanya hampir satu peratus daripada GPT-4-Turbo May 07, 2024 pm 04:13 PM

Bayangkan model kecerdasan buatan yang bukan sahaja mempunyai keupayaan untuk mengatasi pengkomputeran tradisional, tetapi juga mencapai prestasi yang lebih cekap pada kos yang lebih rendah. Ini bukan fiksyen sains, DeepSeek-V2[1], model MoE sumber terbuka paling berkuasa di dunia ada di sini. DeepSeek-V2 ialah gabungan model bahasa pakar (MoE) yang berkuasa dengan ciri-ciri latihan ekonomi dan inferens yang cekap. Ia terdiri daripada 236B parameter, 21B daripadanya digunakan untuk mengaktifkan setiap penanda. Berbanding dengan DeepSeek67B, DeepSeek-V2 mempunyai prestasi yang lebih kukuh, sambil menjimatkan 42.5% kos latihan, mengurangkan cache KV sebanyak 93.3% dan meningkatkan daya pemprosesan penjanaan maksimum kepada 5.76 kali. DeepSeek ialah sebuah syarikat yang meneroka kecerdasan buatan am

Apr 09, 2024 am 11:52 AM

AI memang mengubah matematik. Baru-baru ini, Tao Zhexuan, yang telah mengambil perhatian terhadap isu ini, telah memajukan keluaran terbaru "Buletin Persatuan Matematik Amerika" (Buletin Persatuan Matematik Amerika). Memfokuskan pada topik "Adakah mesin akan mengubah matematik?", ramai ahli matematik menyatakan pendapat mereka Seluruh proses itu penuh dengan percikan api, tegar dan menarik. Penulis mempunyai barisan yang kuat, termasuk pemenang Fields Medal Akshay Venkatesh, ahli matematik China Zheng Lejun, saintis komputer NYU Ernest Davis dan ramai lagi sarjana terkenal dalam industri. Dunia AI telah berubah secara mendadak Anda tahu, banyak artikel ini telah dihantar setahun yang lalu.

Google gembira: prestasi JAX mengatasi Pytorch dan TensorFlow! Ia mungkin menjadi pilihan terpantas untuk latihan inferens GPU Apr 01, 2024 pm 07:46 PM

Prestasi JAX, yang dipromosikan oleh Google, telah mengatasi Pytorch dan TensorFlow dalam ujian penanda aras baru-baru ini, menduduki tempat pertama dalam 7 penunjuk. Dan ujian tidak dilakukan pada TPU dengan prestasi JAX terbaik. Walaupun dalam kalangan pembangun, Pytorch masih lebih popular daripada Tensorflow. Tetapi pada masa hadapan, mungkin lebih banyak model besar akan dilatih dan dijalankan berdasarkan platform JAX. Model Baru-baru ini, pasukan Keras menanda aras tiga hujung belakang (TensorFlow, JAX, PyTorch) dengan pelaksanaan PyTorch asli dan Keras2 dengan TensorFlow. Pertama, mereka memilih satu set arus perdana

Hello, Atlas elektrik! Robot Boston Dynamics hidup semula, gerakan pelik 180 darjah menakutkan Musk Apr 18, 2024 pm 07:58 PM

Boston Dynamics Atlas secara rasmi memasuki era robot elektrik! Semalam, Atlas hidraulik hanya "menangis" menarik diri daripada peringkat sejarah Hari ini, Boston Dynamics mengumumkan bahawa Atlas elektrik sedang berfungsi. Nampaknya dalam bidang robot humanoid komersial, Boston Dynamics berazam untuk bersaing dengan Tesla. Selepas video baharu itu dikeluarkan, ia telah pun ditonton oleh lebih sejuta orang dalam masa sepuluh jam sahaja. Orang lama pergi dan peranan baru muncul. Ini adalah keperluan sejarah. Tidak dinafikan bahawa tahun ini adalah tahun letupan robot humanoid. Netizen mengulas: Kemajuan robot telah menjadikan majlis pembukaan tahun ini kelihatan seperti manusia, dan tahap kebebasan adalah jauh lebih besar daripada manusia Tetapi adakah ini benar-benar bukan filem seram? Pada permulaan video, Atlas berbaring dengan tenang di atas tanah, seolah-olah terlentang. Apa yang berikut adalah rahang-jatuh

KAN, yang menggantikan MLP, telah diperluaskan kepada konvolusi oleh projek sumber terbuka Jun 01, 2024 pm 10:03 PM

Awal bulan ini, penyelidik dari MIT dan institusi lain mencadangkan alternatif yang sangat menjanjikan kepada MLP - KAN. KAN mengatasi MLP dari segi ketepatan dan kebolehtafsiran. Dan ia boleh mengatasi prestasi MLP berjalan dengan bilangan parameter yang lebih besar dengan bilangan parameter yang sangat kecil. Sebagai contoh, penulis menyatakan bahawa mereka menggunakan KAN untuk menghasilkan semula keputusan DeepMind dengan rangkaian yang lebih kecil dan tahap automasi yang lebih tinggi. Khususnya, MLP DeepMind mempunyai kira-kira 300,000 parameter, manakala KAN hanya mempunyai kira-kira 200 parameter. KAN mempunyai asas matematik yang kukuh seperti MLP berdasarkan teorem penghampiran universal, manakala KAN berdasarkan teorem perwakilan Kolmogorov-Arnold. Seperti yang ditunjukkan dalam rajah di bawah, KAN telah

750,000 pusingan pertempuran satu lawan satu antara model besar, GPT-4 memenangi kejuaraan, dan Llama 3 menduduki tempat kelima Apr 23, 2024 pm 03:28 PM

Mengenai Llama3, keputusan ujian baharu telah dikeluarkan - komuniti penilaian model besar LMSYS mengeluarkan senarai kedudukan model besar Llama3 menduduki tempat kelima, dan terikat untuk tempat pertama dengan GPT-4 dalam kategori Bahasa Inggeris. Gambar ini berbeza daripada Penanda Aras yang lain Senarai ini berdasarkan pertempuran satu lawan satu antara model, dan penilai dari seluruh rangkaian membuat cadangan dan skor mereka sendiri. Pada akhirnya, Llama3 menduduki tempat kelima dalam senarai, diikuti oleh tiga versi GPT-4 dan Claude3 Super Cup Opus yang berbeza. Dalam senarai tunggal Inggeris, Llama3 mengatasi Claude dan terikat dengan GPT-4. Mengenai keputusan ini, ketua saintis Meta LeCun sangat gembira, tweet semula dan

Robot Tesla bekerja di kilang, Musk: Tahap kebebasan tangan akan mencapai 22 tahun ini! May 06, 2024 pm 04:13 PM

Video terbaru robot Tesla Optimus dikeluarkan, dan ia sudah boleh berfungsi di kilang. Pada kelajuan biasa, ia mengisih bateri (bateri 4680 Tesla) seperti ini: Pegawai itu juga mengeluarkan rupanya pada kelajuan 20x - pada "stesen kerja" kecil, memilih dan memilih dan memilih: Kali ini ia dikeluarkan Salah satu sorotan video itu ialah Optimus menyelesaikan kerja ini di kilang, sepenuhnya secara autonomi, tanpa campur tangan manusia sepanjang proses. Dan dari perspektif Optimus, ia juga boleh mengambil dan meletakkan bateri yang bengkok, memfokuskan pada pembetulan ralat automatik: Berkenaan tangan Optimus, saintis NVIDIA Jim Fan memberikan penilaian yang tinggi: Tangan Optimus adalah robot lima jari di dunia paling cerdik. Tangannya bukan sahaja boleh disentuh

FisheyeDetNet: algoritma pengesanan sasaran pertama berdasarkan kamera fisheye Apr 26, 2024 am 11:37 AM

Pengesanan objek ialah masalah yang agak matang dalam sistem pemanduan autonomi, antaranya pengesanan pejalan kaki adalah salah satu algoritma terawal untuk digunakan. Penyelidikan yang sangat komprehensif telah dijalankan dalam kebanyakan kertas kerja. Walau bagaimanapun, persepsi jarak menggunakan kamera fisheye untuk pandangan sekeliling agak kurang dikaji. Disebabkan herotan jejari yang besar, perwakilan kotak sempadan standard sukar dilaksanakan dalam kamera fisheye. Untuk mengurangkan perihalan di atas, kami meneroka kotak sempadan lanjutan, elips dan reka bentuk poligon am ke dalam perwakilan kutub/sudut dan mentakrifkan metrik mIOU pembahagian contoh untuk menganalisis perwakilan ini. Model fisheyeDetNet yang dicadangkan dengan bentuk poligon mengatasi model lain dan pada masa yang sama mencapai 49.5% mAP pada set data kamera fisheye Valeo untuk pemanduan autonomi

See all articles