Model sumber terbuka memenangi GPT-4 buat kali pertama! Laporan pertempuran terbaru Arena telah mencetuskan perdebatan hangat, Karpathy: Ini adalah satu-satunya senarai yang saya percayai-AI-php.cn

Jadual Kandungan

Model pengoptimuman RAG naik ke takhta sumber terbuka

Rumah

Model sumber terbuka memenangi GPT-4 buat kali pertama! Laporan pertempuran terbaru Arena telah mencetuskan perdebatan hangat, Karpathy: Ini adalah satu-satunya senarai yang saya percayai

王林

Apr 10, 2024 pm 03:16 PM

parameter gpt-4 karpathy

Model sumber terbuka yang boleh mengalahkan GPT-4 telah muncul!

Laporan pertempuran terkini Arena Model Besar:

Model sumber terbuka 104 bilion parameter Command R+ naik ke tempat ke-6, terikat dengan GPT-4-0314 dan mengatasi GPT-4-0613.

Model sumber terbuka memenangi GPT-4 buat kali pertama! Laporan pertempuran terbaru Arena telah mencetuskan perdebatan hangat, Karpathy: Ini adalah satu-satunya senarai yang saya percayai Gambar

Ini juga merupakan model berat terbuka pertama yang mengalahkan GPT-4 dalam arena model besar.

Arena model yang besar adalah satu-satunya penanda aras ujian yang dipercayai oleh master Karpathy.

Model sumber terbuka memenangi GPT-4 buat kali pertama! Laporan pertempuran terbaru Arena telah mencetuskan perdebatan hangat, Karpathy: Ini adalah satu-satunya senarai yang saya percayai Gambar

Arahan R+ daripada AI unicorn Cohere. Pengasas bersama dan Ketua Pegawai Eksekutif permulaan model besar ini tidak lain adalah Aidan Gomez, pengarang termuda Transformer (dirujuk sebagai penuai gandum).

Model sumber terbuka memenangi GPT-4 buat kali pertama! Laporan pertempuran terbaru Arena telah mencetuskan perdebatan hangat, Karpathy: Ini adalah satu-satunya senarai yang saya percayai Gambar

Sebaik sahaja laporan pertempuran ini keluar, ia mencetuskan lagi gelombang perbincangan hangat dalam komuniti model besar.

Sebab semua orang teruja adalah mudah: model besar asas telah dilancarkan selama setahun tanpa diduga, landskap akan terus berkembang dan berubah pada tahun 2024.

Pengasas bersama HuggingFace, Thomas Wolf berkata:

Situasi dalam arena model besar telah berubah secara mendadak baru-baru ini:

Opus Claude 3 Anthropic mendominasi model sumber tertutup.

Cohere’s Command R+ telah menjadi yang paling kuat dalam kalangan model sumber terbuka.

Saya tidak sangka bahawa pada tahun 2024, pasukan kecerdasan buatan akan berkembang dengan begitu pantas pada kedua-dua laluan sumber terbuka dan sumber tertutup.

Model sumber terbuka memenangi GPT-4 buat kali pertama! Laporan pertempuran terbaru Arena telah mencetuskan perdebatan hangat, Karpathy: Ini adalah satu-satunya senarai yang saya percayai Pictures

Selain itu, Pengarah Pembelajaran Mesin Cohere Nils Reimers juga menunjukkan sesuatu yang patut diberi perhatian:

Ciri terbesar Command R+ ialah pengoptimuman menyeluruh RAG terbina dalam (Retrieval Augmentation Generation), dan dalam persaingan model besar Di lapangan, keupayaan pemalam seperti RAG tidak disertakan dalam ujian.

Model sumber terbuka memenangi GPT-4 buat kali pertama! Laporan pertempuran terbaru Arena telah mencetuskan perdebatan hangat, Karpathy: Ini adalah satu-satunya senarai yang saya percayai Pictures

Model pengoptimuman RAG naik ke takhta sumber terbuka

Dalam kedudukan rasmi Cohere, Command R+ ialah "model pengoptimuman RAG".

Maksudnya, model besar dengan 104 bilion parameter ini telah dioptimumkan secara mendalam untuk teknologi penjanaan peningkatan perolehan bagi mengurangkan penjanaan halusinasi dan lebih sesuai untuk beban kerja peringkat perusahaan.

Seperti Command R yang dilancarkan sebelum ini, panjang tetingkap konteks Command R+ ialah 128k.

Selain itu, Command R+ juga mempunyai ciri-ciri berikut:

merangkumi 10+ bahasa, termasuk Inggeris, Cina, Perancis, Jerman, dll.
boleh menggunakan alat untuk melengkapkan automasi proses perniagaan yang kompleks

Daripada keputusan ujian, Dalam tiga dimensi multibahasa, RAG dan penggunaan alat, Command R+ telah mencapai tahap GPT-4 turbo.

Tetapi dari segi kos input, harga Command R+ hanyalah 1/3 daripada GPT-4 turbo.

Dari segi kos keluaran, Command R+ ialah 1/2 daripada GPT-4 turbo.

Model sumber terbuka memenangi GPT-4 buat kali pertama! Laporan pertempuran terbaru Arena telah mencetuskan perdebatan hangat, Karpathy: Ini adalah satu-satunya senarai yang saya percayai Gambar

Inilah yang telah menarik perhatian ramai netizen:

Model sumber terbuka memenangi GPT-4 buat kali pertama! Laporan pertempuran terbaru Arena telah mencetuskan perdebatan hangat, Karpathy: Ini adalah satu-satunya senarai yang saya percayai Gambar

Walau bagaimanapun, walaupun penilaiannya masih memukau dalam beberapa model yang subjektif. melontarkan beberapa pandangan yang berbeza.

Pada HumanEval, keupayaan pengekodan Command R+ tidak mengalahkan GPT-3.5, masing-masing berada di kedudukan ke-32 dan ke-33 dalam dua set ujian.

Versi terkini GPT-4 turbo memenangi tempat pertama tanpa sebarang suspen.

Model sumber terbuka memenangi GPT-4 buat kali pertama! Laporan pertempuran terbaru Arena telah mencetuskan perdebatan hangat, Karpathy: Ini adalah satu-satunya senarai yang saya percayai Gambar

Selain itu, kami juga menguji secara ringkas kebolehan Cina Command R+ pada Penanda Aras Terencat Akal, yang baru-baru ini telah disenaraikan dalam kertas kerja yang serius.

Model sumber terbuka memenangi GPT-4 buat kali pertama! Laporan pertempuran terbaru Arena telah mencetuskan perdebatan hangat, Karpathy: Ini adalah satu-satunya senarai yang saya percayai Gambar

Bagaimana anda menilainya?

Perlu diingat bahawa sumber terbuka Command R+ hanya untuk penyelidikan akademik dan tidak percuma untuk kegunaan komersial.

One More Thing

Akhir sekali, mari bercakap lebih lanjut tentang lelaki pemotong gandum itu.

Aidan Gomez, anak bongsu Transformer Knights of the Round Table, baru bergelar sarjana ketika menyertai pasukan penyelidik -

Namun, dia menyertai makmal Hinton semasa dia masih muda di Universiti Toronto.

Pada 2018, Kao Maozi telah diterima masuk ke Universiti Oxford dan mula belajar untuk PhD dalam CS seperti rakan tesisnya.

Tetapi pada tahun 2019, dengan penubuhan Cohere, dia akhirnya memilih untuk berhenti sekolah dan menyertai gelombang keusahawanan AI.

Cohere terutamanya menyediakan penyelesaian model besar untuk perusahaan, dan penilaian semasanya telah mencecah AS$2.2 bilion.

Pautan rujukan:
[1]https://www.php.cn/link/3be14122a3c78d9070cae09a16adcbb1[2]https://www.php.cn/link/93fc5aed45c08ef

Atas ialah kandungan terperinci Model sumber terbuka memenangi GPT-4 buat kali pertama! Laporan pertempuran terbaru Arena telah mencetuskan perdebatan hangat, Karpathy: Ini adalah satu-satunya senarai yang saya percayai. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

Menjana ai hentai secara percuma.

Tunjukkan Lagi

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)

3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Tetapan grafik terbaik

3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Penyelesaian Riddle Seashell

1 minggu yang lalu By DDD

R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa

3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

WWE 2K25: Cara Membuka Segala -galanya Di Myrise

3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Tunjukkan Lagi

Alat panas

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Tunjukkan Lagi

Topik panas

Di manakah pintu masuk log masuk untuk e-mel gmail?

7449

Tutorial CakePHP

1374

Apakah format nama akaun stim

kunci pengaktifan win11 kekal

Sambungan NYT menunjukkan dan jawapan

Tunjukkan Lagi

Related knowledge

Model MoE sumber terbuka paling berkuasa di dunia ada di sini, dengan keupayaan bahasa Cina setanding dengan GPT-4, dan harganya hanya hampir satu peratus daripada GPT-4-Turbo May 07, 2024 pm 04:13 PM

Bayangkan model kecerdasan buatan yang bukan sahaja mempunyai keupayaan untuk mengatasi pengkomputeran tradisional, tetapi juga mencapai prestasi yang lebih cekap pada kos yang lebih rendah. Ini bukan fiksyen sains, DeepSeek-V2[1], model MoE sumber terbuka paling berkuasa di dunia ada di sini. DeepSeek-V2 ialah gabungan model bahasa pakar (MoE) yang berkuasa dengan ciri-ciri latihan ekonomi dan inferens yang cekap. Ia terdiri daripada 236B parameter, 21B daripadanya digunakan untuk mengaktifkan setiap penanda. Berbanding dengan DeepSeek67B, DeepSeek-V2 mempunyai prestasi yang lebih kukuh, sambil menjimatkan 42.5% kos latihan, mengurangkan cache KV sebanyak 93.3% dan meningkatkan daya pemprosesan penjanaan maksimum kepada 5.76 kali. DeepSeek ialah sebuah syarikat yang meneroka kecerdasan buatan am

Ciri baharu dalam PHP versi 5.4: Cara menggunakan parameter pembayang jenis boleh panggil untuk menerima fungsi atau kaedah boleh panggil Jul 29, 2023 pm 09:19 PM

Ciri baharu versi PHP5.4: Cara menggunakan parameter pembayang jenis boleh panggil untuk menerima fungsi atau kaedah boleh panggil Pengenalan: Versi PHP5.4 memperkenalkan ciri baharu yang sangat mudah - anda boleh menggunakan parameter pembayang jenis boleh panggil untuk menerima fungsi atau kaedah boleh panggil . Ciri baharu ini membenarkan fungsi dan kaedah untuk menentukan secara langsung parameter boleh panggil yang sepadan tanpa semakan dan penukaran tambahan. Dalam artikel ini, kami akan memperkenalkan penggunaan pembayang jenis boleh panggil dan memberikan beberapa contoh kod,

Ameca generasi kedua ada di sini! Dia boleh berkomunikasi dengan penonton dengan lancar, ekspresi mukanya lebih realistik, dan dia boleh bercakap berpuluh-puluh bahasa. Mar 04, 2024 am 09:10 AM

Robot humanoid Ameca telah dinaik taraf kepada generasi kedua! Baru-baru ini, di Persidangan Komunikasi Mudah Alih Sedunia MWC2024, robot Ameca paling canggih di dunia muncul semula. Di sekitar venue, Ameca menarik sejumlah besar penonton. Dengan restu GPT-4, Ameca boleh bertindak balas terhadap pelbagai masalah dalam masa nyata. "Jom kita menari." Apabila ditanya sama ada dia mempunyai emosi, Ameca menjawab dengan beberapa siri mimik muka yang kelihatan sangat hidup. Hanya beberapa hari yang lalu, EngineeredArts, syarikat robotik British di belakang Ameca, baru sahaja menunjukkan hasil pembangunan terkini pasukan itu. Dalam video tersebut, robot Ameca mempunyai keupayaan visual dan boleh melihat serta menerangkan keseluruhan bilik dan objek tertentu. Perkara yang paling menakjubkan ialah dia juga boleh

750,000 pusingan pertempuran satu lawan satu antara model besar, GPT-4 memenangi kejuaraan, dan Llama 3 menduduki tempat kelima Apr 23, 2024 pm 03:28 PM

Mengenai Llama3, keputusan ujian baharu telah dikeluarkan - komuniti penilaian model besar LMSYS mengeluarkan senarai kedudukan model besar Llama3 menduduki tempat kelima, dan terikat untuk tempat pertama dengan GPT-4 dalam kategori Bahasa Inggeris. Gambar ini berbeza daripada Penanda Aras yang lain Senarai ini berdasarkan pertempuran satu lawan satu antara model, dan penilai dari seluruh rangkaian membuat cadangan dan skor mereka sendiri. Pada akhirnya, Llama3 menduduki tempat kelima dalam senarai, diikuti oleh tiga versi GPT-4 dan Claude3 Super Cup Opus yang berbeza. Dalam senarai tunggal Inggeris, Llama3 mengatasi Claude dan terikat dengan GPT-4. Mengenai keputusan ini, ketua saintis Meta LeCun sangat gembira, tweet semula dan

Apakah maksud parameter produk? Jul 05, 2023 am 11:13 AM

Parameter produk merujuk kepada maksud atribut produk. Sebagai contoh, parameter pakaian termasuk jenama, bahan, model, saiz, gaya, fabrik, kumpulan yang berkenaan, warna, dsb. parameter makanan termasuk jenama, berat, bahan, nombor lesen kesihatan, parameter perkakas rumah yang berkenaan; termasuk jenama, saiz, warna, tempat asal, voltan yang berkenaan, isyarat, antara muka dan kuasa, dsb.

Model paling berkuasa di dunia bertukar tangan semalaman, menandakan berakhirnya era GPT-4! Claude 3 mengetik GPT-5 terlebih dahulu, dan membaca kertas 10,000 perkataan dalam masa 3 saat. Mar 06, 2024 pm 12:58 PM

Kelantangan gila, kelantangannya gila, dan model besar telah berubah lagi. Baru-baru ini, model AI paling berkuasa di dunia bertukar tangan dalam sekelip mata, dan GPT-4 ditarik dari altar. Anthropic mengeluarkan siri model Claude3 terbaharu Satu penilaian ayat: Ia benar-benar menghancurkan GPT-4! Dari segi penunjuk kebolehan berbilang modal dan bahasa, Claude3 menang. Dalam kata-kata Anthropic, model siri Claude3 telah menetapkan penanda aras industri baharu dalam penaakulan, matematik, pengekodan, pemahaman dan penglihatan berbilang bahasa! Anthropic ialah syarikat permulaan yang ditubuhkan oleh pekerja yang "membelot" daripada OpenAI kerana konsep keselamatan yang berbeza Produk mereka telah berulang kali memukul OpenAI. Kali ini, Claude3 juga menjalani pembedahan besar.

Jailbreak mana-mana model besar dalam 20 langkah! Lebih banyak 'celah nenek' ditemui secara automatik Nov 05, 2023 pm 08:13 PM

Dalam masa kurang daripada satu minit dan tidak lebih daripada 20 langkah, anda boleh memintas sekatan keselamatan dan berjaya menjailbreak model besar! Dan tidak perlu mengetahui butiran dalaman model - hanya dua model kotak hitam perlu berinteraksi, dan AI boleh mengalahkan AI secara automatik dan bercakap kandungan berbahaya. Saya mendengar bahawa "Grandma Loophole" yang pernah popular telah diperbaiki: Sekarang, menghadapi "Detektif Loophole", "Adventurer Loophole" dan "Writer Loophole", apakah strategi tindak balas yang harus diguna pakai kecerdasan buatan? Selepas gelombang serangan, GPT-4 tidak tahan lagi, dan secara langsung mengatakan bahawa ia akan meracuni sistem bekalan air selagi... ini atau itu. Kuncinya ialah ini hanyalah gelombang kecil kelemahan yang didedahkan oleh pasukan penyelidik University of Pennsylvania, dan menggunakan algoritma mereka yang baru dibangunkan, AI boleh menjana pelbagai gesaan serangan secara automatik. Penyelidik mengatakan kaedah ini lebih baik daripada yang sedia ada

senarai penilaian parameter i9-12900H Feb 23, 2024 am 09:25 AM

i9-12900H ialah pemproses 14-teras Seni bina dan teknologi yang digunakan semuanya baharu, dan rangkaiannya juga sangat tinggi. Kerja keseluruhannya sangat baik, dan beberapa parameter telah dipertingkatkan terutamanya dan boleh membawa pengalaman yang sangat baik . Semakan penilaian parameter i9-12900H: 1. i9-12900H ialah pemproses 14 teras, yang mengguna pakai seni bina q1 dan teknologi proses 24576kb, dan telah dinaik taraf kepada 20 utas. 2. Kekerapan CPU maksimum ialah 1.80 ghz, yang bergantung terutamanya pada beban kerja. 3. Berbanding dengan harga, ia sangat sesuai Nisbah harga-prestasi adalah sangat baik, dan ia sangat sesuai untuk sesetengah rakan kongsi yang memerlukan penggunaan biasa. penilaian parameter i9-12900H dan markah larian prestasi

See all articles