Model sumber terbuka yang setanding dengan GPT-4 bocor! Bos Mistral baru saja mengesahkan: versi rasmi akan menjadi lebih kuat-AI-php.cn

Jadual Kandungan

Mistral-Medium secara tidak sengaja bocor

Rumah

Model sumber terbuka yang setanding dengan GPT-4 bocor! Bos Mistral baru saja mengesahkan: versi rasmi akan menjadi lebih kuat

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Feb 01, 2024 pm 09:00 PM

gpt-4 Model Sumber terbuka

Mistral-Medium terbocor secara tidak sengaja? Sebelum ini hanya tersedia melalui API, prestasi hampir dengan GPT-4.

Kenyataan terbaru CEO: Memang benar, ia telah dibocorkan oleh pekerja pelanggan awal. Tetapi masih berkata Stay tuned.

Model sumber terbuka yang setanding dengan GPT-4 bocor! Bos Mistral baru saja mengesahkan: versi rasmi akan menjadi lebih kuat Gambar

Dalam erti kata lain, versi ini masih lama, dan prestasi versi sebenar akan menjadi lebih baik.

Sejak dua hari lepas, model misteri bernama "Miqu" ini menjadi topik hangat dalam komuniti model besar, ramai juga mengesyaki bahawa ini adalah versi LIama yang telah diperhalusi.

Model sumber terbuka yang setanding dengan GPT-4 bocor! Bos Mistral baru saja mengesahkan: versi rasmi akan menjadi lebih kuat Pictures

CEO Mistral menjelaskan bahawa mereka telah melatih semula Mistral Medium dan menambah baiknya berdasarkan Llama 2. Ini adalah untuk menyampaikan API yang hampir dengan prestasi GPT-4 kepada pelanggan awal secepat mungkin. Kerja pra-latihan telah selesai pada hari Mistral 7B dikeluarkan.

Sekarang kebenaran telah terbongkar, CEO masih berahsia, dan ramai netizen yang mencucuk tangan mereka dalam jangkaan.

Model sumber terbuka yang setanding dengan GPT-4 bocor! Bos Mistral baru saja mengesahkan: versi rasmi akan menjadi lebih kuat Gambar

Mistral-Medium secara tidak sengaja bocor

Mari kita semak semula keseluruhan kejadian. Pada 28 Januari, seorang pengguna misteri bernama Miqu Dev menyiarkan satu set fail "miqu-1-70b" di HuggingFace.

Model sumber terbuka yang setanding dengan GPT-4 bocor! Bos Mistral baru saja mengesahkan: versi rasmi akan menjadi lebih kuat Pictures

Dokumen tersebut menyatakan bahawa "format segera" dan kaedah interaksi pengguna LLM baharu adalah sama seperti Mistral.

Pada hari yang sama, pengguna tanpa nama di 4chan menyiarkan pautan ke fail miqu-1-70b.

Jadi ada netizen yang perasan model misteri ini dan mula menjalankan beberapa ujian penanda aras.

Hasilnya menakjubkan: ia mendapat markah 83.5 pada EQ-Bench (penilaian tempatan), menungguli semua model besar lain di dunia kecuali GPT-4.

Untuk sementara waktu, netizen menggesa agar model besar ini dimasukkan ke dalam ranking dan mengetahui model sebenar di sebaliknya.

Terdapat tiga arah utama syak wasangka:

dan Mistral-Medium adalah model yang sama.

Sesetengah netizen menyiarkan kesan perbandingan: Ia tahu jawapan standard dan ia masuk akal, tetapi adalah mustahil walaupun perkataan Rusia sama persis dengan Mistral-Medium.

Model sumber terbuka yang setanding dengan GPT-4 bocor! Bos Mistral baru saja mengesahkan: versi rasmi akan menjadi lebih kuat Gambar

Miqu sepatutnya menjadi versi LIama 2 yang diperhalusi.

Tetapi netizen lain mendapati ia bukan model KPM, dan mempunyai seni bina yang sama, parameter yang sama dan bilangan lapisan yang sama seperti LIama 2.

Model sumber terbuka yang setanding dengan GPT-4 bocor! Bos Mistral baru saja mengesahkan: versi rasmi akan menjadi lebih kuat Gambar

Namun, ia segera dipersoalkan oleh netizen lain Mistral 7b juga mempunyai parameter dan bilangan lapisan yang sama seperti llama 7B.

Sebaliknya, ini lebih seperti model Mistral versi awal bukan MoE.

Model sumber terbuka yang setanding dengan GPT-4 bocor! Bos Mistral baru saja mengesahkan: versi rasmi akan menjadi lebih kuat Gambar

Namun, selepas berbincang, memang tidak dinafikan dalam fikiran ramai, inilah model yang paling hampir dengan GPT-4.

Model sumber terbuka yang setanding dengan GPT-4 bocor! Bos Mistral baru saja mengesahkan: versi rasmi akan menjadi lebih kuat Pictures

Kini, pengasas bersama dan Ketua Pegawai Eksekutif Mistral Arthur Mensch telah mengakui bahawa salah seorang pekerja pelanggan awal mereka terlalu bersemangat dan membocorkan versi terkuantisasi model lama yang mereka latih dan keluarkan secara terbuka.

Bagi Perplexity, CEO juga menjelaskan bahawa mereka tidak pernah menerima berat Mistral Medium.

Model sumber terbuka yang setanding dengan GPT-4 bocor! Bos Mistral baru saja mengesahkan: versi rasmi akan menjadi lebih kuat Gambar

Netizen bimbang sama ada versi ini akan dialih keluar.

Model sumber terbuka yang setanding dengan GPT-4 bocor! Bos Mistral baru saja mengesahkan: versi rasmi akan menjadi lebih kuat Gambar

Menariknya, Mensch tidak meminta siaran di HuggingFace dibuang.

Model sumber terbuka yang setanding dengan GPT-4 bocor! Bos Mistral baru saja mengesahkan: versi rasmi akan menjadi lebih kuat Gambar

Sebaliknya, tinggalkan ulasan yang menyatakan: Isu atribusi boleh dipertimbangkan.

Pautan rujukan:
[1]https://www.reddit.com/r/LocalLLaMA/comments/1af4fbg/llm_comparisontest_miqu170b/
[2]https://twitter.com/teortaxesTex915
[3]https://twitter.com/N8Programs/status/1752441060133892503
[4]https://twitter.com/AravSrinivas/status/1752803571035504858

Atas ialah kandungan terperinci Model sumber terbuka yang setanding dengan GPT-4 bocor! Bos Mistral baru saja mengesahkan: versi rasmi akan menjadi lebih kuat. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

Menjana ai hentai secara percuma.

Tunjukkan Lagi

Artikel Panas

Assassin's Creed Shadows: Penyelesaian Riddle Seashell

3 minggu yang lalu By DDD

Apa yang Baru di Windows 11 KB5054979 & Cara Memperbaiki Masalah Kemas Kini

2 minggu yang lalu By DDD

Di mana untuk mencari kad kunci kawalan kren di atomfall

3 minggu yang lalu By DDD

Penjimatan di R.E.P.O. Dijelaskan (dan simpan fail)

1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows - Cara Mencari Orang Panda

4 minggu yang lalu By DDD

Tunjukkan Lagi

Alat panas

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Tunjukkan Lagi

Topik panas

Di manakah pintu masuk log masuk untuk e-mel gmail?

7563

Tutorial CakePHP

1385

Apakah format nama akaun stim

kunci pengaktifan win11 kekal

Sambungan NYT menunjukkan dan jawapan

Tunjukkan Lagi

Related knowledge

Model MoE sumber terbuka paling berkuasa di dunia ada di sini, dengan keupayaan bahasa Cina setanding dengan GPT-4, dan harganya hanya hampir satu peratus daripada GPT-4-Turbo May 07, 2024 pm 04:13 PM

Bayangkan model kecerdasan buatan yang bukan sahaja mempunyai keupayaan untuk mengatasi pengkomputeran tradisional, tetapi juga mencapai prestasi yang lebih cekap pada kos yang lebih rendah. Ini bukan fiksyen sains, DeepSeek-V2[1], model MoE sumber terbuka paling berkuasa di dunia ada di sini. DeepSeek-V2 ialah gabungan model bahasa pakar (MoE) yang berkuasa dengan ciri-ciri latihan ekonomi dan inferens yang cekap. Ia terdiri daripada 236B parameter, 21B daripadanya digunakan untuk mengaktifkan setiap penanda. Berbanding dengan DeepSeek67B, DeepSeek-V2 mempunyai prestasi yang lebih kukuh, sambil menjimatkan 42.5% kos latihan, mengurangkan cache KV sebanyak 93.3% dan meningkatkan daya pemprosesan penjanaan maksimum kepada 5.76 kali. DeepSeek ialah sebuah syarikat yang meneroka kecerdasan buatan am

Apr 09, 2024 am 11:52 AM

AI memang mengubah matematik. Baru-baru ini, Tao Zhexuan, yang telah mengambil perhatian terhadap isu ini, telah memajukan keluaran terbaru "Buletin Persatuan Matematik Amerika" (Buletin Persatuan Matematik Amerika). Memfokuskan pada topik "Adakah mesin akan mengubah matematik?", ramai ahli matematik menyatakan pendapat mereka Seluruh proses itu penuh dengan percikan api, tegar dan menarik. Penulis mempunyai barisan yang kuat, termasuk pemenang Fields Medal Akshay Venkatesh, ahli matematik China Zheng Lejun, saintis komputer NYU Ernest Davis dan ramai lagi sarjana terkenal dalam industri. Dunia AI telah berubah secara mendadak Anda tahu, banyak artikel ini telah dihantar setahun yang lalu.

Hello, Atlas elektrik! Robot Boston Dynamics hidup semula, gerakan pelik 180 darjah menakutkan Musk Apr 18, 2024 pm 07:58 PM

Boston Dynamics Atlas secara rasmi memasuki era robot elektrik! Semalam, Atlas hidraulik hanya "menangis" menarik diri daripada peringkat sejarah Hari ini, Boston Dynamics mengumumkan bahawa Atlas elektrik sedang berfungsi. Nampaknya dalam bidang robot humanoid komersial, Boston Dynamics berazam untuk bersaing dengan Tesla. Selepas video baharu itu dikeluarkan, ia telah pun ditonton oleh lebih sejuta orang dalam masa sepuluh jam sahaja. Orang lama pergi dan peranan baru muncul. Ini adalah keperluan sejarah. Tidak dinafikan bahawa tahun ini adalah tahun letupan robot humanoid. Netizen mengulas: Kemajuan robot telah menjadikan majlis pembukaan tahun ini kelihatan seperti manusia, dan tahap kebebasan adalah jauh lebih besar daripada manusia Tetapi adakah ini benar-benar bukan filem seram? Pada permulaan video, Atlas berbaring dengan tenang di atas tanah, seolah-olah terlentang. Apa yang berikut adalah rahang-jatuh

KAN, yang menggantikan MLP, telah diperluaskan kepada konvolusi oleh projek sumber terbuka Jun 01, 2024 pm 10:03 PM

Awal bulan ini, penyelidik dari MIT dan institusi lain mencadangkan alternatif yang sangat menjanjikan kepada MLP - KAN. KAN mengatasi MLP dari segi ketepatan dan kebolehtafsiran. Dan ia boleh mengatasi prestasi MLP berjalan dengan bilangan parameter yang lebih besar dengan bilangan parameter yang sangat kecil. Sebagai contoh, penulis menyatakan bahawa mereka menggunakan KAN untuk menghasilkan semula keputusan DeepMind dengan rangkaian yang lebih kecil dan tahap automasi yang lebih tinggi. Khususnya, MLP DeepMind mempunyai kira-kira 300,000 parameter, manakala KAN hanya mempunyai kira-kira 200 parameter. KAN mempunyai asas matematik yang kukuh seperti MLP berdasarkan teorem penghampiran universal, manakala KAN berdasarkan teorem perwakilan Kolmogorov-Arnold. Seperti yang ditunjukkan dalam rajah di bawah, KAN telah

750,000 pusingan pertempuran satu lawan satu antara model besar, GPT-4 memenangi kejuaraan, dan Llama 3 menduduki tempat kelima Apr 23, 2024 pm 03:28 PM

Mengenai Llama3, keputusan ujian baharu telah dikeluarkan - komuniti penilaian model besar LMSYS mengeluarkan senarai kedudukan model besar Llama3 menduduki tempat kelima, dan terikat untuk tempat pertama dengan GPT-4 dalam kategori Bahasa Inggeris. Gambar ini berbeza daripada Penanda Aras yang lain Senarai ini berdasarkan pertempuran satu lawan satu antara model, dan penilai dari seluruh rangkaian membuat cadangan dan skor mereka sendiri. Pada akhirnya, Llama3 menduduki tempat kelima dalam senarai, diikuti oleh tiga versi GPT-4 dan Claude3 Super Cup Opus yang berbeza. Dalam senarai tunggal Inggeris, Llama3 mengatasi Claude dan terikat dengan GPT-4. Mengenai keputusan ini, ketua saintis Meta LeCun sangat gembira, tweet semula dan

Disyorkan: Projek pengesanan dan pengecaman muka sumber terbuka JS yang sangat baik Apr 03, 2024 am 11:55 AM

Teknologi pengesanan dan pengecaman muka adalah teknologi yang agak matang dan digunakan secara meluas. Pada masa ini, bahasa aplikasi Internet yang paling banyak digunakan ialah JS Melaksanakan pengesanan muka dan pengecaman pada bahagian hadapan Web mempunyai kelebihan dan kekurangan berbanding dengan pengecaman muka bahagian belakang. Kelebihan termasuk mengurangkan interaksi rangkaian dan pengecaman masa nyata, yang sangat memendekkan masa menunggu pengguna dan meningkatkan pengalaman pengguna termasuk: terhad oleh saiz model, ketepatannya juga terhad. Bagaimana untuk menggunakan js untuk melaksanakan pengesanan muka di web? Untuk melaksanakan pengecaman muka di Web, anda perlu biasa dengan bahasa dan teknologi pengaturcaraan yang berkaitan, seperti JavaScript, HTML, CSS, WebRTC, dll. Pada masa yang sama, anda juga perlu menguasai visi komputer yang berkaitan dan teknologi kecerdasan buatan. Perlu diingat bahawa kerana reka bentuk bahagian Web

Robot Tesla bekerja di kilang, Musk: Tahap kebebasan tangan akan mencapai 22 tahun ini! May 06, 2024 pm 04:13 PM

Video terbaru robot Tesla Optimus dikeluarkan, dan ia sudah boleh berfungsi di kilang. Pada kelajuan biasa, ia mengisih bateri (bateri 4680 Tesla) seperti ini: Pegawai itu juga mengeluarkan rupanya pada kelajuan 20x - pada "stesen kerja" kecil, memilih dan memilih dan memilih: Kali ini ia dikeluarkan Salah satu sorotan video itu ialah Optimus menyelesaikan kerja ini di kilang, sepenuhnya secara autonomi, tanpa campur tangan manusia sepanjang proses. Dan dari perspektif Optimus, ia juga boleh mengambil dan meletakkan bateri yang bengkok, memfokuskan pada pembetulan ralat automatik: Berkenaan tangan Optimus, saintis NVIDIA Jim Fan memberikan penilaian yang tinggi: Tangan Optimus adalah robot lima jari di dunia paling cerdik. Tangannya bukan sahaja boleh disentuh

FisheyeDetNet: algoritma pengesanan sasaran pertama berdasarkan kamera fisheye Apr 26, 2024 am 11:37 AM

Pengesanan objek ialah masalah yang agak matang dalam sistem pemanduan autonomi, antaranya pengesanan pejalan kaki adalah salah satu algoritma terawal untuk digunakan. Penyelidikan yang sangat komprehensif telah dijalankan dalam kebanyakan kertas kerja. Walau bagaimanapun, persepsi jarak menggunakan kamera fisheye untuk pandangan sekeliling agak kurang dikaji. Disebabkan herotan jejari yang besar, perwakilan kotak sempadan standard sukar dilaksanakan dalam kamera fisheye. Untuk mengurangkan perihalan di atas, kami meneroka kotak sempadan lanjutan, elips dan reka bentuk poligon am ke dalam perwakilan kutub/sudut dan mentakrifkan metrik mIOU pembahagian contoh untuk menganalisis perwakilan ini. Model fisheyeDetNet yang dicadangkan dengan bentuk poligon mengatasi model lain dan pada masa yang sama mencapai 49.5% mAP pada set data kamera fisheye Valeo untuk pemanduan autonomi

See all articles