Rumah > Peranti teknologi > AI > teks badan

Model sumber terbuka yang setanding dengan GPT-4 bocor! Bos Mistral baru saja mengesahkan: versi rasmi akan menjadi lebih kuat

WBOY
Lepaskan: 2024-02-01 21:00:47
ke hadapan
968 orang telah melayarinya

Mistral-Medium terbocor secara tidak sengaja? Sebelum ini hanya tersedia melalui API, prestasi hampir dengan GPT-4.

Kenyataan terbaru CEO: Memang benar, ia telah dibocorkan oleh pekerja pelanggan awal. Tetapi masih berkata Stay tuned.

Model sumber terbuka yang setanding dengan GPT-4 bocor! Bos Mistral baru saja mengesahkan: versi rasmi akan menjadi lebih kuatGambar

Dalam erti kata lain, versi ini masih lama, dan prestasi versi sebenar akan menjadi lebih baik.

Sejak dua hari lepas, model misteri bernama "Miqu" ini menjadi topik hangat dalam komuniti model besar, ramai juga mengesyaki bahawa ini adalah versi LIama yang telah diperhalusi.

Model sumber terbuka yang setanding dengan GPT-4 bocor! Bos Mistral baru saja mengesahkan: versi rasmi akan menjadi lebih kuatPictures

CEO Mistral menjelaskan bahawa mereka telah melatih semula Mistral Medium dan menambah baiknya berdasarkan Llama 2. Ini adalah untuk menyampaikan API yang hampir dengan prestasi GPT-4 kepada pelanggan awal secepat mungkin. Kerja pra-latihan telah selesai pada hari Mistral 7B dikeluarkan.

Sekarang kebenaran telah terbongkar, CEO masih berahsia, dan ramai netizen yang mencucuk tangan mereka dalam jangkaan.

Model sumber terbuka yang setanding dengan GPT-4 bocor! Bos Mistral baru saja mengesahkan: versi rasmi akan menjadi lebih kuatGambar

Model sumber terbuka yang setanding dengan GPT-4 bocor! Bos Mistral baru saja mengesahkan: versi rasmi akan menjadi lebih kuatGambar

Mistral-Medium secara tidak sengaja bocor

Mari kita semak semula keseluruhan kejadian. Pada 28 Januari, seorang pengguna misteri bernama Miqu Dev menyiarkan satu set fail "miqu-1-70b" di HuggingFace.

Model sumber terbuka yang setanding dengan GPT-4 bocor! Bos Mistral baru saja mengesahkan: versi rasmi akan menjadi lebih kuatPictures

Dokumen tersebut menyatakan bahawa "format segera" dan kaedah interaksi pengguna LLM baharu adalah sama seperti Mistral.

Pada hari yang sama, pengguna tanpa nama di 4chan menyiarkan pautan ke fail miqu-1-70b.

Jadi ada netizen yang perasan model misteri ini dan mula menjalankan beberapa ujian penanda aras.

Hasilnya menakjubkan: ia mendapat markah 83.5 pada EQ-Bench (penilaian tempatan), menungguli semua model besar lain di dunia kecuali GPT-4.

Untuk sementara waktu, netizen menggesa agar model besar ini dimasukkan ke dalam ranking dan mengetahui model sebenar di sebaliknya.

Terdapat tiga arah utama syak wasangka:

  • dan Mistral-Medium adalah model yang sama.

Sesetengah netizen menyiarkan kesan perbandingan: Ia tahu jawapan standard dan ia masuk akal, tetapi adalah mustahil walaupun perkataan Rusia sama persis dengan Mistral-Medium.

Model sumber terbuka yang setanding dengan GPT-4 bocor! Bos Mistral baru saja mengesahkan: versi rasmi akan menjadi lebih kuatGambar

  • Miqu sepatutnya menjadi versi LIama 2 yang diperhalusi.

Tetapi netizen lain mendapati ia bukan model KPM, dan mempunyai seni bina yang sama, parameter yang sama dan bilangan lapisan yang sama seperti LIama 2.

Model sumber terbuka yang setanding dengan GPT-4 bocor! Bos Mistral baru saja mengesahkan: versi rasmi akan menjadi lebih kuatGambar

Namun, ia segera dipersoalkan oleh netizen lain Mistral 7b juga mempunyai parameter dan bilangan lapisan yang sama seperti llama 7B.

Sebaliknya, ini lebih seperti model Mistral versi awal bukan MoE.

Model sumber terbuka yang setanding dengan GPT-4 bocor! Bos Mistral baru saja mengesahkan: versi rasmi akan menjadi lebih kuatGambar

Namun, selepas berbincang, memang tidak dinafikan dalam fikiran ramai, inilah model yang paling hampir dengan GPT-4.

Model sumber terbuka yang setanding dengan GPT-4 bocor! Bos Mistral baru saja mengesahkan: versi rasmi akan menjadi lebih kuatPictures

Kini, pengasas bersama dan Ketua Pegawai Eksekutif Mistral Arthur Mensch telah mengakui bahawa salah seorang pekerja pelanggan awal mereka terlalu bersemangat dan membocorkan versi terkuantisasi model lama yang mereka latih dan keluarkan secara terbuka.

Bagi Perplexity, CEO juga menjelaskan bahawa mereka tidak pernah menerima berat Mistral Medium.

Model sumber terbuka yang setanding dengan GPT-4 bocor! Bos Mistral baru saja mengesahkan: versi rasmi akan menjadi lebih kuatGambar

Netizen bimbang sama ada versi ini akan dialih keluar.

Model sumber terbuka yang setanding dengan GPT-4 bocor! Bos Mistral baru saja mengesahkan: versi rasmi akan menjadi lebih kuatGambar

Menariknya, Mensch tidak meminta siaran di HuggingFace dibuang.

Model sumber terbuka yang setanding dengan GPT-4 bocor! Bos Mistral baru saja mengesahkan: versi rasmi akan menjadi lebih kuatGambar

Sebaliknya, tinggalkan ulasan yang menyatakan: Isu atribusi boleh dipertimbangkan.

Pautan rujukan:
[1]https://www.reddit.com/r/LocalLLaMA/comments/1af4fbg/llm_comparisontest_miqu170b/

[2]https://twitter.com/teortaxesTex915
[3]https://twitter.com/N8Programs/status/1752441060133892503
[4]https://twitter.com/AravSrinivas/status/1752803571035504858

Atas ialah kandungan terperinci Model sumber terbuka yang setanding dengan GPT-4 bocor! Bos Mistral baru saja mengesahkan: versi rasmi akan menjadi lebih kuat. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Label berkaitan:
sumber:51cto.com
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan
Tentang kita Penafian Sitemap
Laman web PHP Cina:Latihan PHP dalam talian kebajikan awam,Bantu pelajar PHP berkembang dengan cepat!