Selepas 11 hari sumber terbuka, Musk mengeluarkan semula kod Grok-1.5 128K mengalahkan GPT-4-AI-php.cn

Rumah

Selepas 11 hari sumber terbuka, Musk mengeluarkan semula kod Grok-1.5 128K mengalahkan GPT-4

Mar 30, 2024 am 08:01 AM

data kereta api

Grok-1 telah diumumkan secara rasmi sebagai sumber terbuka selama setengah bulan sahaja, dan Grok-1.5 yang baru dinaik taraf dikeluarkan.

Sebentar tadi, Musk xAI secara rasmi mengumumkan bahawa konteks 128K Grok-1.5 telah mempertingkatkan keupayaan penaakulannya.

Dan, ia akan berada dalam talian tidak lama lagi.

Selepas 11 hari sumber terbuka, Musk mengeluarkan semula kod Grok-1.5 128K mengalahkan GPT-4

11 hari yang lalu, pemberat dan seni bina model Grok-1 adalah sumber terbuka, menunjukkan kemajuan yang dicapai Xai sebelum November lalu.

Grok-1 mempunyai 314 bilion parameter, iaitu 4 kali lebih besar daripada Llama 2, dan menggunakan seni bina KPM 2 daripada 8 pakar adalah pakar aktif.

Selepas 11 hari sumber terbuka, Musk mengeluarkan semula kod Grok-1.5 128K mengalahkan GPT-4

Pengenalan Xai, iaitu sejak itu, pasukan telah meningkatkan keupayaan penaakulan dan penyelesaian masalah model terbaru Grok-1.5.

Selepas 11 hari sumber terbuka, Musk mengeluarkan semula kod Grok-1.5 128K mengalahkan GPT-4

Bekas ketua perhubungan pembangun di OpenAI berkata bahawa kepantasan dan rasa tergesa-gesa mereka dapat dilihat daripada masa keluaran utama xAI. Mengujakan!

Selepas 11 hari sumber terbuka, Musk mengeluarkan semula kod Grok-1.5 128K mengalahkan GPT-4

128K konteks, kebolehan penaakulan matematik Grok-1.5 meroket

Menurut pengenalan rasmi, Grok-1.5 telah menambah baik kebolehan penaakulan 1.2K.

Selepas 11 hari sumber terbuka, Musk mengeluarkan semula kod Grok-1.5 128K mengalahkan GPT-4

Salah satu peningkatan paling ketara kepada Grok-1.5 ialah prestasinya dalam pengekodan dan tugasan berkaitan matematik.

Dalam ujian, Grok-1.5 mencapai markah 50.6% pada penanda aras matematik dan 90% pada penanda aras GSM8K ini merangkumi pelbagai masalah pertandingan dari sekolah rendah hingga sekolah menengah.

Selain itu, Grok-1.5 mencapai skor tinggi sebanyak 74.1% dalam penanda aras HumanEval yang menilai penjanaan kod dan keupayaan menyelesaikan masalah.

Daripada gambar di bawah, berbanding dengan Grok-1, dapat dilihat bahawa keupayaan matematik Grok-1.5 telah bertambah baik, daripada 62.9% kepada 90 pada GSM8K, dan daripada 23.9% kepada 50.6% pada MATH.

Selepas 11 hari sumber terbuka, Musk mengeluarkan semula kod Grok-1.5 128K mengalahkan GPT-4

128K pemahaman konteks panjang, dikembangkan 16 kali ganda

Satu lagi ciri baharu Grok-1.5 ialah keupayaan untuk mengendalikan teksnya sehingga 12 konteks

Ini meningkatkan kapasiti ingatan Grok kepada 16 kali ganda panjang konteks sebelumnya, membolehkannya memanfaatkan maklumat daripada dokumen yang lebih panjang.

Selepas 11 hari sumber terbuka, Musk mengeluarkan semula kod Grok-1.5 128K mengalahkan GPT-4

Selain itu, model baharu ini boleh mengendalikan gesaan yang lebih panjang dan lebih kompleks sambil mengekalkan keupayaannya untuk mengikut arahan apabila tetingkap konteksnya berkembang.

Dalam penilaian Needle In A Haystack (NIAH), Grok-1.5 menunjukkan keupayaan mendapatkan semula yang kukuh, mendapatkan semula teks terbenam dalam konteks sehingga 128K bait panjangnya dan mencapai hasil perolehan semula yang sempurna.

Infrastruktur Grok-1.5

Grok-1.5 dibina di atas rangka kerja latihan teragih tersuai berdasarkan JAX, Rust dan Kubernetes.

Timbunan latihan ini membolehkan pasukan xAI membina idea pada skala dan melatih seni bina baharu dengan pelaburan yang minimum.

Cabaran utama dalam melatih LLM pada kelompok pengkomputeran yang besar adalah untuk memaksimumkan kebolehpercayaan dan masa operasi tugas latihan.

Orkestra latihan tersuai xAI memastikan nod yang bermasalah dikesan secara automatik dan dihapuskan daripada tugas latihan.

Pada masa yang sama, mereka juga mengoptimumkan pemeriksaan, pemuatan data dan memulakan semula tugas latihan untuk meminimumkan masa henti sekiranya berlaku kegagalan.

xAI menyatakan bahawa Grok-1.5 akan tersedia kepada penguji awal tidak lama lagi untuk membantu menambah baik model.

Blog ini juga melihat beberapa ciri baharu yang akan dilancarkan oleh Grok-1.5 dalam beberapa hari akan datang.

Akhirnya, xAI menyiarkan maklumat pengambilan seperti biasa.

Selepas 11 hari sumber terbuka, Musk mengeluarkan semula kod Grok-1.5 128K mengalahkan GPT-4

Atas ialah kandungan terperinci Selepas 11 hari sumber terbuka, Musk mengeluarkan semula kod Grok-1.5 128K mengalahkan GPT-4. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)

2 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Repo: Cara menghidupkan semula rakan sepasukan

3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Hello Kitty Island Adventure: Cara mendapatkan biji gergasi

3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Berapa lama masa yang diperlukan untuk mengalahkan fiksyen berpecah?

3 minggu yang lalu By DDD

R.E.P.O. Simpan Fail Lokasi: Di manakah & bagaimana untuk melindunginya?

3 minggu yang lalu By DDD

Tunjukkan Lagi

Alat panas Tag

Kod&IT

Suara

Perniagaan

Pemasaran

Pengesan AI

Chatbot

Reka bentuk&Seni

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)

2 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Repo: Cara menghidupkan semula rakan sepasukan

3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Hello Kitty Island Adventure: Cara mendapatkan biji gergasi

3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Berapa lama masa yang diperlukan untuk mengalahkan fiksyen berpecah?

3 minggu yang lalu By DDD

R.E.P.O. Simpan Fail Lokasi: Di manakah & bagaimana untuk melindunginya?

3 minggu yang lalu By DDD

Tunjukkan Lagi

Tag artikel panas

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Tunjukkan Lagi

Topik panas

Di manakah pintu masuk log masuk untuk e-mel gmail?

7310

Tutorial Java

1624

Tutorial CakePHP

1346

Tutorial Laravel

1259

Tutorial PHP

1207

Tunjukkan Lagi

Related knowledge

Gunakan ddrescue untuk memulihkan data pada Linux Mar 20, 2024 pm 01:37 PM

Gunakan ddrescue untuk memulihkan data pada Linux

Sumber terbuka! Di luar ZoeDepth! DepthFM: Anggaran kedalaman monokular yang cepat dan tepat! Apr 03, 2024 pm 12:04 PM

Sumber terbuka! Di luar ZoeDepth! DepthFM: Anggaran kedalaman monokular yang cepat dan tepat!

Daya hidup kecerdasan super membangkitkan! Tetapi dengan kedatangan AI yang mengemas kini sendiri, ibu tidak perlu lagi bimbang tentang kesesakan data Apr 29, 2024 pm 06:55 PM

Daya hidup kecerdasan super membangkitkan! Tetapi dengan kedatangan AI yang mengemas kini sendiri, ibu tidak perlu lagi bimbang tentang kesesakan data

Google gembira: prestasi JAX mengatasi Pytorch dan TensorFlow! Ia mungkin menjadi pilihan terpantas untuk latihan inferens GPU Apr 01, 2024 pm 07:46 PM

Google gembira: prestasi JAX mengatasi Pytorch dan TensorFlow! Ia mungkin menjadi pilihan terpantas untuk latihan inferens GPU

Hello, Atlas elektrik! Robot Boston Dynamics hidup semula, gerakan pelik 180 darjah menakutkan Musk Apr 18, 2024 pm 07:58 PM

Hello, Atlas elektrik! Robot Boston Dynamics hidup semula, gerakan pelik 180 darjah menakutkan Musk

Versi Kuaishou Sora 'Ke Ling' dibuka untuk ujian: menghasilkan video lebih 120-an, memahami fizik dengan lebih baik dan boleh memodelkan pergerakan kompleks dengan tepat Jun 11, 2024 am 09:51 AM

Versi Kuaishou Sora 'Ke Ling' dibuka untuk ujian: menghasilkan video lebih 120-an, memahami fizik dengan lebih baik dan boleh memodelkan pergerakan kompleks dengan tepat

Kelajuan Internet Data Selular Perlahan pada iPhone: Pembetulan May 03, 2024 pm 09:01 PM

Kelajuan Internet Data Selular Perlahan pada iPhone: Pembetulan

Tentera Udara A.S. mempamerkan jet pejuang AI pertamanya dengan profil tinggi! Menteri secara peribadi menjalankan pandu uji tanpa campur tangan semasa keseluruhan proses, dan 100,000 baris kod telah diuji selama 21 kali. May 07, 2024 pm 05:00 PM

See all articles