Rumah Peranti teknologi AI Dengan hanya 1/17 kos latihan Llama3, model MoE sumber terbuka Snowflake 128x3B

Dengan hanya 1/17 kos latihan Llama3, model MoE sumber terbuka Snowflake 128x3B

Apr 25, 2024 pm 04:10 PM
apache industri teknologi pemampatan

Snowflake menyertai pergaduhan LLM.


Snowflake mengeluarkan model "kecerdasan perusahaan" tinggi Artik, memfokuskan pada aplikasi perusahaan dalaman.

Sebentar tadi, pengurusan data dan penyedia gudang Snowflake mengumumkan bahawa ia telah menyertai pergaduhan LLM dan mengeluarkan model bahasa besar (LLM) peringkat atas yang memfokuskan pada aplikasi peringkat perusahaan - Snowflake Arctic.

Sebagai LLM yang dilancarkan oleh syarikat pengkomputeran awan, Arctic terutamanya mempunyai dua kelebihan berikut:

  • Kecerdasan Cekap: Arctic berfungsi dengan baik dalam tugas perusahaan, seperti penjanaan arahan SQL., , malah setanding dengan model sumber terbuka yang dilatih dengan kos pengiraan yang lebih tinggi. Arctic menetapkan garis dasar baharu untuk latihan kos efektif, membolehkan pelanggan Snowflake mencipta model tersuai berkualiti tinggi pada kos rendah untuk keperluan perusahaan mereka.
  • Sumber terbuka: Arctic mengguna pakai lesen Apache 2.0, menyediakan akses terbuka kepada pemberat dan kod, dan Snowflake juga akan membuka sumber semua penyelesaian data dan penemuan penyelidikan.

Kini anda boleh mengakses model Artik pada Muka Memeluk. Snowflake berkata: Pengguna tidak lama lagi akan dapat memperolehnya melalui beberapa perpustakaan model, termasuk Snowflake Cortex, AWS, Microsoft Azure, NVIDIA API, Lamini, Perplexity, Replicate and Together, dsb.
仅需Llama3 1/17的训练成本,Snowflake开源128x3B MoE模型
Muka Memeluk: https://huggingface.co/Snowflake/snowflake-arctic-instruct

Tetingkap konteks Artik ditetapkan kepada 4K, dan pasukan penyelidik sedang membangunkan tetingkap tenggelam perhatian berasaskan pelaksanaan akan menyokong penjanaan jujukan tanpa had dalam beberapa minggu akan datang dan akan dikembangkan kepada 32K tetingkap perhatian dalam masa terdekat.

Prestasi tinggi, kos rendah

Pasukan penyelidik Snowflake melihat corak yang konsisten daripada keperluan AI dan kes penggunaan pelanggan perusahaan: perusahaan ingin menggunakan LLM untuk membina kod kod SQL perbualan copilot dan RAG chatbots.

Ini bermakna LLM perlu cemerlang dalam SQL, kod, mengikut arahan yang kompleks dan menjana respons konkrit. Snowflake menggabungkan keupayaan ini ke dalam satu metrik yang dipanggil "Kecerdasan Perusahaan" dengan mengekod purata (HumanEval+ dan MBPP+), penjanaan SQL (Spider) dan tahap prestasi arahan (IFEval).

Arctic mencapai tahap tertinggi "kecerdasan perusahaan" dalam LLM sumber terbuka, dan melakukannya pada kos pengiraan latihan lebih kurang $2 juta (kurang daripada 3K minggu GPU). Ini bermakna Artik lebih berkebolehan daripada model sumber terbuka lain yang dilatih dengan kos pengiraan yang serupa.

Lebih penting lagi, Arctic cemerlang dalam kecerdasan perusahaan walaupun jika dibandingkan dengan model yang dilatih dengan kos pengiraan yang jauh lebih tinggi. Kecekapan latihan Arctic yang tinggi bermakna pelanggan Snowflake dan komuniti AI pada umumnya boleh melatih model tersuai dengan lebih menjimatkan kos.

Seperti yang ditunjukkan dalam Rajah 1, Artik adalah setanding dengan LLAMA 3 8B dan LLAMA 2 70B pada metrik kecerdasan perusahaan sambil menggunakan kurang daripada separuh kos pengiraan latihan. Dan, walaupun hanya menggunakan 1/17 kali ganda kos pengkomputeran, Arctic adalah setanding dengan Llama3 70B dalam penunjuk seperti pengekodan (HumanEval+ dan MBPP+), SQL (Spider) dan arahan mengikut (IFEval), iaitu, Arctic mengekalkan daya saing prestasi keseluruhan melakukan ini pada masa yang sama.
仅需Llama3 1/17的训练成本,Snowflake开源128x3B MoE模型
仅需Llama3 1/17的训练成本,Snowflake开源128x3B MoE模型
Selain itu, Snowflake juga menilai Artik pada penanda aras akademik, melibatkan pengetahuan dunia, penaakulan akal dan kebolehan matematik Keputusan penilaian lengkap ditunjukkan dalam rajah di bawah:
仅需Llama3 1/17的训练成本,Snowflake开源128x3B MoE模型
仅需Llama3 1/17的训练成本,Snowflake开源128x3B MoE模型

Kecekapan Latihan
🎜🎜🎜🎜Untuk mencapai kecekapan latihan di atas, Artik menggunakan seni bina pengubah hibrid Dense-MoE yang unik. Ia menggabungkan model pengubah padat 10B dengan baki MLP MoE 128×3.66B, dengan jumlah parameter 480B dan parameter aktif 17B, menggunakan gating atas-2 untuk pemilihan.

Apabila merancang dan melatih Artik, pasukan penyelidikan menggunakan tiga pandangan utama dan inovasi berikut:

moe pakar dan teknologi mampatan

Pada akhir 2021, pasukan deepspeed ditunjukkan bahawa MoE boleh digunakan untuk LLM autoregresif, dengan itu meningkatkan kualiti model dengan ketara tanpa meningkatkan kos pengiraan. Semasa mereka bentuk Artik, pasukan penyelidik menyedari bahawa berdasarkan idea ini, peningkatan kualiti model bergantung terutamanya pada bilangan pakar dan jumlah parameter dalam model MoE, serta bilangan gabungan pakar ini.

Berdasarkan perkara ini, Arctic direka bentuk untuk mengedarkan parameter 480B di kalangan 128 pakar berbutir halus dan menggunakan gating 2 teratas untuk memilih parameter aktif 17B. . Snowflake mendapati bahawa overhed ini boleh dihapuskan jika komunikasi boleh bertindih dengan pengiraan.

Oleh itu, Artik menggabungkan pengubah padat dengan komponen sisa MoE (Rajah 2) untuk mengira pertindihan melalui komunikasi, membolehkan sistem latihan mencapai kecekapan latihan yang baik, menyembunyikan kebanyakan overhed komunikasi.

Pembelajaran Kurikulum Berfokus pada Data Perusahaan

Prestasi cemerlang dalam metrik peringkat perusahaan seperti penjanaan kod dan SQL memerlukan pembelajaran kurikulum data (Pembelajaran Kurikulum) yang sama sekali berbeza daripada metrik umum Melalui ratusan eksperimen ablasi berskala kecil, pasukan mengetahui bahawa kemahiran umum, seperti penaakulan akal, boleh dipelajari pada peringkat awal manakala metrik yang lebih kompleks, seperti pengekodan, matematik dan SQL, boleh dipelajari dengan berkesan kemudian; latihan.
仅需Llama3 1/17的训练成本,Snowflake开源128x3B MoE模型
Ini boleh dibandingkan dengan pendidikan kehidupan manusia, secara beransur-ansur memperoleh kebolehan daripada mudah kepada sukar. Oleh itu, Artik menggunakan kurikulum tiga peringkat, dengan setiap peringkat mempunyai komposisi data yang berbeza, dengan peringkat pertama memfokuskan pada kemahiran umum (token 1T) dan dua peringkat terakhir memfokuskan pada kemahiran perusahaan (token 1.5T dan 1T).

Kecekapan inferens

Kecekapan inferens juga merupakan aspek penting dalam kecekapan model, yang mempengaruhi sama ada model boleh digunakan pada kos yang rendah.
仅需Llama3 1/17的训练成本,Snowflake开源128x3B MoE模型
Artik mewakili lonjakan dalam saiz model MoE, menggunakan lebih ramai pakar dan jumlah parameter daripada mana-mana model MoE regresi sumber terbuka lain. Oleh itu, Snowflake memerlukan beberapa idea inovatif untuk memastikan Artik boleh membuat kesimpulan dengan cekap:
仅需Llama3 1/17的训练成本,Snowflake开源128x3B MoE模型a) Dalam inferens interaktif dengan saiz kelompok kecil, seperti saiz kelompok 1, kependaman inferens model MoE dihadkan dengan membaca semua parameter aktif Masa, inferens dihadkan oleh lebar jalur memori. Pada saiz kelompok ini, volum bacaan memori Artik (parameter aktif 17B) hanyalah 1/4 daripada Kod-Llama 70B dan 2/5 daripada Mixtral 8x22B (parameter aktif 44B), menghasilkan kadar inferens yang lebih pantas.

b) Apabila saiz kelompok meningkat dengan ketara, seperti beribu-ribu token setiap hantaran hadapan, Artik bergerak daripada lebar jalur memori terhad kepada terhad secara pengiraan, dengan inferens dihadkan oleh parameter aktif setiap token. Dalam hal ini, Artik ialah 1/4 usaha pengiraan CodeLlama 70B dan Llama 3 70B.

Untuk mencapai inferens terikat pengiraan dan daya pemprosesan tinggi yang sepadan dengan bilangan kecil parameter aktif di Artik, saiz kelompok yang lebih besar diperlukan. Untuk mencapai ini memerlukan cache KV yang mencukupi untuk menyokongnya, serta memori yang mencukupi untuk menyimpan hampir 500B parameter model.

Walaupun mencabar, Snowflake mencapai ini dengan menggunakan dua nod untuk inferens dan menggabungkan pengoptimuman sistem seperti pemberat FP8, fius berpecah dan batching berterusan, selari tensor intra-nod dan selari saluran paip antara nod.

Pasukan penyelidik telah bekerjasama rapat dengan NVIDIA untuk mengoptimumkan inferens untuk perkhidmatan mikro NVIDIA NIM yang dipacu oleh TensorRT-LLM. Pada masa yang sama, pasukan penyelidik juga bekerjasama dengan komuniti vLLM, dan pasukan pembangunan dalaman juga akan melaksanakan inferens cekap Artik untuk kes penggunaan perusahaan dalam beberapa minggu akan datang.

Pautan rujukan: https://www.snowflake.com/blog/arctic-open-efficient-foundation-language-models-snowflake/

Atas ialah kandungan terperinci Dengan hanya 1/17 kos latihan Llama3, model MoE sumber terbuka Snowflake 128x3B. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Tetapan grafik terbaik
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Cara Membuka Segala -galanya Di Myrise
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Cakar mekanikal pertama! Yuanluobao muncul di Persidangan Robot Dunia 2024 dan mengeluarkan robot catur pertama yang boleh memasuki rumah Cakar mekanikal pertama! Yuanluobao muncul di Persidangan Robot Dunia 2024 dan mengeluarkan robot catur pertama yang boleh memasuki rumah Aug 21, 2024 pm 07:33 PM

Pada 21 Ogos, Persidangan Robot Dunia 2024 telah diadakan dengan megah di Beijing. Jenama robot rumah SenseTime "Yuanluobot SenseRobot" telah memperkenalkan seluruh keluarga produknya, dan baru-baru ini mengeluarkan robot permainan catur AI Yuanluobot - Edisi Profesional Catur (selepas ini dirujuk sebagai "Yuanluobot SenseRobot"), menjadi robot catur A pertama di dunia untuk rumah. Sebagai produk robot permainan catur ketiga Yuanluobo, robot Guoxiang baharu telah melalui sejumlah besar peningkatan teknikal khas dan inovasi dalam AI dan jentera kejuruteraan Buat pertama kalinya, ia telah menyedari keupayaan untuk mengambil buah catur tiga dimensi melalui cakar mekanikal pada robot rumah, dan melaksanakan Fungsi mesin manusia seperti bermain catur, semua orang bermain catur, semakan notasi, dsb.

Claude pun dah jadi malas! Netizen: Belajar untuk memberi percutian kepada diri sendiri Claude pun dah jadi malas! Netizen: Belajar untuk memberi percutian kepada diri sendiri Sep 02, 2024 pm 01:56 PM

Permulaan sekolah akan bermula, dan bukan hanya pelajar yang akan memulakan semester baharu yang harus menjaga diri mereka sendiri, tetapi juga model AI yang besar. Beberapa ketika dahulu, Reddit dipenuhi oleh netizen yang mengadu Claude semakin malas. "Tahapnya telah banyak menurun, ia sering berhenti seketika, malah output menjadi sangat singkat. Pada minggu pertama keluaran, ia boleh menterjemah dokumen penuh 4 halaman sekaligus, tetapi kini ia tidak dapat mengeluarkan separuh halaman pun. !" https:// www.reddit.com/r/ClaudeAI/comments/1by8rw8/something_just_feels_wrong_with_claude_in_the/ dalam siaran bertajuk "Totally disappointed with Claude", penuh dengan

Pada Persidangan Robot Sedunia, robot domestik yang membawa 'harapan penjagaan warga tua masa depan' ini telah dikepung Pada Persidangan Robot Sedunia, robot domestik yang membawa 'harapan penjagaan warga tua masa depan' ini telah dikepung Aug 22, 2024 pm 10:35 PM

Pada Persidangan Robot Dunia yang diadakan di Beijing, paparan robot humanoid telah menjadi tumpuan mutlak di gerai Stardust Intelligent, pembantu robot AI S1 mempersembahkan tiga persembahan utama dulcimer, seni mempertahankan diri dan kaligrafi dalam. satu kawasan pameran, berkebolehan kedua-dua sastera dan seni mempertahankan diri, menarik sejumlah besar khalayak profesional dan media. Permainan elegan pada rentetan elastik membolehkan S1 menunjukkan operasi halus dan kawalan mutlak dengan kelajuan, kekuatan dan ketepatan. CCTV News menjalankan laporan khas mengenai pembelajaran tiruan dan kawalan pintar di sebalik "Kaligrafi Pengasas Syarikat Lai Jie menjelaskan bahawa di sebalik pergerakan sutera, bahagian perkakasan mengejar kawalan daya terbaik dan penunjuk badan yang paling menyerupai manusia (kelajuan, beban). dll.), tetapi di sisi AI, data pergerakan sebenar orang dikumpulkan, membolehkan robot menjadi lebih kuat apabila ia menghadapi situasi yang kuat dan belajar untuk berkembang dengan cepat. Dan tangkas

Anugerah ACL 2024 Diumumkan: Salah satu Kertas Terbaik mengenai Pentafsiran Oracle oleh HuaTech, Anugerah Ujian Masa GloVe Anugerah ACL 2024 Diumumkan: Salah satu Kertas Terbaik mengenai Pentafsiran Oracle oleh HuaTech, Anugerah Ujian Masa GloVe Aug 15, 2024 pm 04:37 PM

Pada persidangan ACL ini, para penyumbang telah mendapat banyak keuntungan. ACL2024 selama enam hari diadakan di Bangkok, Thailand. ACL ialah persidangan antarabangsa teratas dalam bidang linguistik pengiraan dan pemprosesan bahasa semula jadi Ia dianjurkan oleh Persatuan Antarabangsa untuk Linguistik Pengiraan dan diadakan setiap tahun. ACL sentiasa menduduki tempat pertama dalam pengaruh akademik dalam bidang NLP, dan ia juga merupakan persidangan yang disyorkan CCF-A. Persidangan ACL tahun ini adalah yang ke-62 dan telah menerima lebih daripada 400 karya termaju dalam bidang NLP. Petang semalam, persidangan itu mengumumkan kertas kerja terbaik dan anugerah lain. Kali ini, terdapat 7 Anugerah Kertas Terbaik (dua tidak diterbitkan), 1 Anugerah Kertas Tema Terbaik, dan 35 Anugerah Kertas Cemerlang. Persidangan itu turut menganugerahkan 3 Anugerah Kertas Sumber (ResourceAward) dan Anugerah Impak Sosial (

Pasukan Li Feifei mencadangkan ReKep untuk memberi robot kecerdasan spatial dan mengintegrasikan GPT-4o Pasukan Li Feifei mencadangkan ReKep untuk memberi robot kecerdasan spatial dan mengintegrasikan GPT-4o Sep 03, 2024 pm 05:18 PM

Penyepaduan mendalam penglihatan dan pembelajaran robot. Apabila dua tangan robot bekerja bersama-sama dengan lancar untuk melipat pakaian, menuang teh dan mengemas kasut, ditambah pula dengan 1X robot humanoid NEO yang telah menjadi tajuk berita baru-baru ini, anda mungkin mempunyai perasaan: kita seolah-olah memasuki zaman robot. Malah, pergerakan sutera ini adalah hasil teknologi robotik canggih + reka bentuk bingkai yang indah + model besar berbilang modal. Kami tahu bahawa robot yang berguna sering memerlukan interaksi yang kompleks dan indah dengan alam sekitar, dan persekitaran boleh diwakili sebagai kekangan dalam domain spatial dan temporal. Sebagai contoh, jika anda ingin robot menuang teh, robot terlebih dahulu perlu menggenggam pemegang teko dan memastikannya tegak tanpa menumpahkan teh, kemudian gerakkannya dengan lancar sehingga mulut periuk sejajar dengan mulut cawan. , dan kemudian condongkan teko pada sudut tertentu. ini

AI sedang digunakan |. Permainan Amway AI yang gila oleh CEO Microsoft telah menyeksa saya beribu kali AI sedang digunakan |. Permainan Amway AI yang gila oleh CEO Microsoft telah menyeksa saya beribu kali Aug 14, 2024 am 12:00 AM

Editor Laporan Kuasa Mesin: Yang Wen Gelombang kecerdasan buatan yang diwakili oleh model besar dan AIGC telah mengubah cara kita hidup dan bekerja secara senyap-senyap, tetapi kebanyakan orang masih tidak tahu cara menggunakannya. Oleh itu, kami telah melancarkan lajur "AI dalam Penggunaan" untuk memperkenalkan secara terperinci cara menggunakan AI melalui kes penggunaan kecerdasan buatan yang intuitif, menarik dan padat serta merangsang pemikiran semua orang. Kami juga mengalu-alukan pembaca untuk menyerahkan kes penggunaan yang inovatif dan praktikal. Ya Tuhan, AI benar-benar menjadi seorang yang genius. Baru-baru ini, ia menjadi topik hangat bahawa sukar untuk membezakan ketulenan gambar yang dihasilkan oleh AI. (Untuk butiran, sila pergi ke: AI sedang digunakan | Menjadi kecantikan AI dalam tiga langkah, dan dipukul kembali kepada bentuk asal anda oleh AI dalam sesaat) Selain wanita AI Google yang popular di Internet, pelbagai penjana FLUX telah muncul di platform sosial

Persidangan Kecerdasan Buatan Teragih DAI 2024 Call for Papers: Hari Agen, Richard Sutton, bapa pembelajaran pengukuhan, akan hadir! Yan Shuicheng, Sergey Levine dan saintis DeepMind akan memberikan ucaptama Persidangan Kecerdasan Buatan Teragih DAI 2024 Call for Papers: Hari Agen, Richard Sutton, bapa pembelajaran pengukuhan, akan hadir! Yan Shuicheng, Sergey Levine dan saintis DeepMind akan memberikan ucaptama Aug 22, 2024 pm 08:02 PM

Pengenalan Persidangan Dengan perkembangan pesat sains dan teknologi, kecerdasan buatan telah menjadi kuasa penting dalam menggalakkan kemajuan sosial. Dalam era ini, kami bertuah untuk menyaksikan dan mengambil bahagian dalam inovasi dan aplikasi Kecerdasan Buatan Teragih (DAI). Kecerdasan buatan yang diedarkan adalah cabang penting dalam bidang kecerdasan buatan, yang telah menarik lebih banyak perhatian dalam beberapa tahun kebelakangan ini. Agen berdasarkan model bahasa besar (LLM) tiba-tiba muncul Dengan menggabungkan pemahaman bahasa yang kuat dan keupayaan penjanaan model besar, mereka telah menunjukkan potensi besar dalam interaksi bahasa semula jadi, penaakulan pengetahuan, perancangan tugas, dsb. AIAgent mengambil alih model bahasa besar dan telah menjadi topik hangat dalam kalangan AI semasa. Au

Model OpenAI 'Strawberi' telah ditangguhkan lagi. Apakah SWE-bench Verified yang dikeluarkan pada awal pagi? Model OpenAI 'Strawberi' telah ditangguhkan lagi. Apakah SWE-bench Verified yang dikeluarkan pada awal pagi? Aug 14, 2024 pm 05:08 PM

Seseorang berkata, "Kami menjangkakan strawberi, tetapi mereka mengeluarkan kangkung Mari kita lihat untuk apa "kale" ini. Keupayaan pengaturcaraan model besar sentiasa menarik perhatian ramai, dan kemunculan Devin, pengaturcara AI yang sangat berkuasa, telah membawa topik "Boleh AI menggantikan pengaturcara" ke hadapan. Baru-baru ini, Devin juga telah membawa masuk lawan baharu - Genie, pengaturcara AI bebas yang dilancarkan oleh syarikat permulaan Cosine. Syarikat itu berkata Genie mudah mengatasi Devin, menjaringkan 30% pada penanda aras pihak ketiga SWE-bench, manakala Devin hanya memperoleh 13.8%. SWE-Bench ini ialah alat untuk menilai penyelesaian LLM kepada Gi

See all articles