Rumah > Peranti teknologi > AI > teks badan

GPT-4 enggan menerima dan telah diambil alih oleh Bard: model terbaru telah memasuki pasaran

WBOY
Lepaskan: 2024-02-01 17:39:54
ke hadapan
701 orang telah melayarinya

Senarai berwibawa "Pertandingan Kelayakan Model Besar" Chatbot Arena telah dimuat semula:

Google Bard melepasi GPT-4 dan menduduki tempat kedua, kedua selepas GPT-4 Turbo.

GPT-4 enggan menerima dan telah diambil alih oleh Bard: model terbaru telah memasuki pasaran

Namun, ramai netizen menyatakan "tidak puas hati" dan "tidak adil" mengenai perkara ini.

Ternyata Jeff Dean, ketua Google AI, mendedahkan bahawa prestasi Bard telah bertambah baik kerana ia dilengkapi dengan versi baharu model besar-Gemini Pro-skala.

GPT-4 enggan menerima dan telah diambil alih oleh Bard: model terbaru telah memasuki pasaran

Ini juga bermakna Bard bermain dalam "perlawanan peringkat" mempunyai keupayaan untuk menyambung ke Internet.

GPT-4 enggan menerima dan telah diambil alih oleh Bard: model terbaru telah memasuki pasaran

Ragu-ragu netizen berkisar tentang perkara ini:

Sangat mudah untuk menimbulkan salah faham dengan mencampurkan model besar dalam talian dan luar talian pada senarai kedudukan yang sama. .

GPT-4 enggan menerima dan telah diambil alih oleh Bard: model terbaru telah memasuki pasaran

Dalam pelbagai keraguan, Imsys secara rasmi bertindak balas, menyatakan:

arena kedudukan adalah masa nyata adalah terbuka dan telus, dan penyelidikan mengenai kepelbagaian segera pengguna dan kualiti pengundian serta set data yang sepadan akan dikeluarkan tidak lama lagi

Berkenaan isu yang paling dibimbangkan oleh netizen, GPT-4, yang diatasi oleh Bard, adalah satu; versi luar talian, Imsys berkata " Jika akses kepada data masa nyata boleh meningkatkan pengalaman pengguna, kedudukan akan mencerminkannya." GPT-4 enggan menerima dan telah diambil alih oleh Bard: model terbaru telah memasuki pasaran

Dan secara langsung @OpenAI dan Bing, serta eksekutif Microsoft Mikhail Parakhin, menyatakan kesediaan mereka untuk menambah versi dalam talian GPT-4 atau Bing Copilot ke arena.

Berita terkini ialah model terbaru OpenAI gpt-4-0125-preview kini telah memasuki arena dan sedang menunggu pengguna untuk mengambil bahagian dalam pengundian.
  • Bagaimana Bard mengatasi GPT-4?

Chatbot Arena ialah senarai model besar yang berwibawa, dicipta oleh organisasi Imsys (Organisasi Sistem Model Besar) yang diketuai oleh penyelidik UC Berkeley.

Kedudukan ini menggunakan peraturan undian 1V1pertempuran tanpa nama dan disenaraikan berdasarkan sistem penilaian Elo.

Secara khusus, halaman undian adalah seperti berikut Kedua-dua model, Model A dan B, kedua-duanya tanpa nama. dan A dan B. Kedua-dua A dan B adalah sama baik.

GPT-4 enggan menerima dan telah diambil alih oleh Bard: model terbaru telah memasuki pasaran

Perlu dinyatakan bahawa jika identiti model dibocorkan semasa proses soal jawab, undian akan menjadi tidak sah.

Mengikut senarai semasa, terdapat 56 model besar dalam arena:

GPT-4 enggan menerima dan telah diambil alih oleh Bard: model terbaru telah memasuki pasaran

Sebelum ini, GPT-4 mendominasi senarai itu untuk masa yang lama dengan skor "jauh ke hadapan". daripada versi baharu Bard, ia secara langsung mengatasi GPT- Kedua-dua versi 4 bergegas ke tempat kedua, dan hanya 34 mata di belakang tempat pertama GPT-4 Turbo:

GPT-4 enggan menerima dan telah diambil alih oleh Bard: model terbaru telah memasuki pasaran

Dengan lebih terperinci, dalam semua Model Perlawanan A vs. B tanpa seri, Model Perkadaran kemenangan A adalah seperti berikut:

GPT-4 enggan menerima dan telah diambil alih oleh Bard: model terbaru telah memasuki pasaran

dan bilangan perlawanan kepala bagi setiap pasangan kombinasi model

(tiada seri) GPT-4 enggan menerima dan telah diambil alih oleh Bard: model terbaru telah memasuki pasaran:

Selain itu, papan pendahulu Arena Chatbot menggunakan bootstrap untuk mencuba secara rawak anggaran skor Elo sebanyak 1,000 kali untuk menilai selang keyakinan dan banyak lagi.

GPT-4 enggan menerima dan telah diambil alih oleh Bard: model terbaru telah memasuki pasaran

Kadar kemenangan purata bagi model tunggal berbanding semua model lain adalah seperti berikut:

GPT-4 enggan menerima dan telah diambil alih oleh Bard: model terbaru telah memasuki pasaran

Walau bagaimanapun, perlu diperhatikan bahawa kedudukan Arena adalah masa nyata, dan walaupun Bard kini berada di kedudukan kedua, ia hanya mempunyai jumlah lebih daripada 3,000 undi.

Sebagai perbandingan, jumlah undian untuk GPT-4 Turbo telah mencecah 30,000+, dan undian kedua-dua versi yang diatasi juga beberapa kali ganda berbanding undian Bard.

GPT-4 enggan menerima dan telah diambil alih oleh Bard: model terbaru telah memasuki pasaran

Sekarang versi terkini GPT-4 telah memasuki pasaran (walaupun masih belum dikemas kini mengenai ranking), kita perlu menunggu keputusan seterusnya~

Pautan rujukan: https:// twitter.com/lmsysorg /status/1752035632489300239.

Atas ialah kandungan terperinci GPT-4 enggan menerima dan telah diambil alih oleh Bard: model terbaru telah memasuki pasaran. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Label berkaitan:
sumber:51cto.com
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan
Tentang kita Penafian Sitemap
Laman web PHP Cina:Latihan PHP dalam talian kebajikan awam,Bantu pelajar PHP berkembang dengan cepat!