Model universal sumber terbuka paling berkuasa NVIDIA Nemotron-4 340B-AI-php.cn

Rumah

Peranti teknologi

Model universal sumber terbuka paling berkuasa NVIDIA Nemotron-4 340B

PHPz

Jun 16, 2024 pm 10:32 PM

NVIDIA industri Nemotron

Prestasi mengatasi Llama-3, terutamanya digunakan untuk data sintetik.

Model besar umum NVIDIA Nemotron telah menggunakan sumber terbuka versi 340 bilion parameter terkini.

Jumaat ini, NVIDIA mengumumkan pelancaran Nemotron-4 340B. Ia mengandungi satu siri model terbuka yang boleh digunakan oleh pembangun untuk menjana data sintetik untuk melatih model bahasa besar (LLM), yang boleh digunakan untuk aplikasi komersial dalam semua industri seperti penjagaan kesihatan, kewangan, pembuatan dan peruncitan.

Data latihan berkualiti tinggi memainkan peranan penting dalam responsif, ketepatan dan kualiti LLM tersuai — tetapi set data yang berkuasa selalunya mahal dan tidak boleh diakses. Melalui lesen model terbuka yang unik, Nemotron-4 340B menyediakan pembangun dengan cara percuma dan berskala untuk menjana data sintetik bagi membantu orang ramai membina LLM yang berkuasa.

Siri Nemotron-4 340B termasuk model Asas, Arahan dan Ganjaran, yang membentuk saluran paip untuk menjana data sintetik untuk latihan dan menambah baik LLM. Model ini dioptimumkan untuk digunakan dengan NVIDIA NeMo, rangka kerja sumber terbuka untuk latihan model hujung ke hujung, termasuk pengurusan data, penyesuaian dan penilaian. Mereka juga dioptimumkan untuk inferens dengan perpustakaan NVIDIA TensorRT-LLM sumber terbuka.

Nvidia berkata Nemotron-4 340B kini tersedia untuk dimuat turun daripada Hugging Face. Pembangun tidak lama lagi akan dapat mengakses model ini di ai.nvidia.com, di mana ia akan dibungkus sebagai perkhidmatan mikro NVIDIA NIM dengan antara muka pengaturcaraan aplikasi standard yang boleh digunakan di mana-mana sahaja.

Muat Turun Muka Memeluk: https://huggingface.co/collections/nvidia/nemotron-4-340b-666b7ebaf1b3867caf2f1911

synthetic

untuk menjana data Nemo

Model bahasa besar boleh Membantu pembangun menjana data latihan sintetik tanpa akses kepada set data berlabel yang besar dan pelbagai.

Model Nemotron-4 340B Instruct mencipta data sintetik pelbagai yang meniru ciri data dunia sebenar, membantu meningkatkan kualiti data dan dengan itu meningkatkan prestasi dan keteguhan LLM tersuai dalam pelbagai domain.

Untuk meningkatkan kualiti data yang dijana AI, pembangun boleh menggunakan model Ganjaran Nemotron-4 340B untuk menapis bagi mendapatkan respons berkualiti tinggi. Nemotron-4 340B Reward menskorkan respons berdasarkan lima atribut: kebolehgunaan, ketepatan, koheren, kerumitan dan keterkataan. Ia kini berada di kedudukan No. 1 pada ranking Hugging Face RewardBench yang dicipta oleh AI2, yang menilai kuasa, keselamatan dan kelemahan model ganjaran. 英伟达开源最强通用模型Nemotron-4 340B

Dalam saluran paip data sintetik ini, (1) model Nemotron-4 340B Instruct digunakan untuk menjana output sintetik berasaskan teks. Kemudian, model penilaian (2) Nemotron-4 340B Reward menilai teks yang dijana dan memberikan maklum balas untuk membimbing penambahbaikan berulang dan memastikan ketepatan data yang disintesis.

Penyelidik juga boleh menyesuaikan model asas Nemotron-4 340B menggunakan data proprietari mereka sendiri, digabungkan dengan set data HelpSteer2 yang disertakan, untuk mencipta model Instruct atau model ganjaran mereka sendiri. . 英伟达开源最强通用模型Nemotron-4 340B

Pengenalan kaedah

Nemotron-4-340B-Seni bina model asas ialah Seni bina Transformer penyahkod sahaja standard dengan topeng perhatian sebab, benam kedudukan diputar (RoPE), tokenizer SentencePiece dan banyak lagi. Hiperparameter Nemotron-4-340B-Base ditunjukkan dalam Jadual 1. Ia mempunyai 9.4 bilion parameter terbenam dan 331.6 bilion parameter tidak terbenam.

Jadual berikut menunjukkan beberapa butiran latihan model Nemotron-4-340B-Base Jadual meringkaskan 3 peringkat kecerunan saiz kelompok, termasuk setiap masa lelaran dan penggunaan model FLOP/s.

Untuk membangunkan model ganjaran yang berkuasa, NVIDIA mengumpul set data 10k data keutamaan manusia yang dipanggil HelpSteer2 dan mengeluarkannya secara terbuka.

Alamat set data: https://huggingface.co/datasets/nvidia/HelpSteer2

Model ganjaran regresi Nemotron-4-340B-Reward dibina pada model Nemotron-4-Base3 Dan gantikan lapisan softmax terakhir dengan pengepala ganjaran baharu. Pengepala ini ialah unjuran linear yang memetakan keadaan tersembunyi lapisan terakhir ke dalam vektor lima dimensi sifat HelpSteer (kebergunaan, ketepatan, koheren, kerumitan, verbositi). Semasa proses inferens, nilai atribut ini boleh diagregatkan ke dalam ganjaran keseluruhan melalui jumlah wajaran. Mod bonus ini menyediakan asas yang kukuh untuk melatih Nemotron-4-340B-Instruct.

Kajian mendapati model sebegini berprestasi sangat baik pada RewardBench:

Ditala halus dengan NeMo dan inferens yang dioptimumkan dengan TensorRT-LLM

Sumber terbuka NVIDIA TenMo

-LLM , pembangun boleh mengoptimumkan kecekapan model bimbingan dan ganjaran mereka untuk menjana data sintetik dan respons skor.

Semua model Nemotron-4 340B dioptimumkan menggunakan TensorRT-LLM untuk memanfaatkan keselarian tensor, sejenis keselarian model di mana matriks berat tunggal dipisahkan merentas berbilang GPU dan pelayan untuk mencapai inferens Cekap pada skala.

Nemotron-4 340B Base dilatih menggunakan 9 trilion token dan boleh disesuaikan menggunakan rangka kerja NeMo agar sesuai dengan kes penggunaan atau domain tertentu. Proses penalaan halus ini mendapat manfaat daripada sejumlah besar data pra-latihan dan menyediakan output yang lebih tepat untuk tugas hiliran tertentu.

Antaranya, rangka kerja NeMo menyediakan pelbagai kaedah penyesuaian, termasuk kaedah penalaan halus yang diselia dan kaedah penalaan yang cekap parameter, seperti penyesuaian peringkat rendah (LoRA).

Untuk meningkatkan kualiti model, pembangun boleh menjajarkan model mereka menggunakan NeMo Aligner dan set data yang dijelaskan oleh Nemotron-4 340B Reward. Penjajaran ialah langkah kritikal dalam melatih model bahasa yang besar, di mana tingkah laku model diperhalusi menggunakan algoritma seperti RLHF untuk memastikan outputnya selamat, tepat, kontekstual dan konsisten dengan matlamat yang dinyatakan.

Perusahaan yang mencari sokongan gred perusahaan dan persekitaran pengeluaran selamat juga boleh mengakses NeMo dan TensorRT-LLM melalui platform perisian NVIDIA AI Enterprise asli awan. Platform ini menyediakan persekitaran masa jalan yang dipercepat dan cekap untuk model asas AI generatif.

Data Penilaian

Rajah 1 menyerlahkan ketepatan keluarga model Nemotron-4 340B pada misi terpilih. Khususnya:

Nemotron-4-340B-Base adalah setanding dengan model asas akses terbuka seperti Llama-3 70B, Mixtral 8x22B dan Qwen-2 72B pada tugas penaakulan akal seperti ARC-Challenge, MMLU dan BigBench tanda aras Setanding.

Dari segi keupayaan mengikuti arahan dan sembang, Nemotron-4-340B-Instruct mengatasi model arahan yang sepadan. Ganjaran Nemotron-4-340B mencapai ketepatan tertinggi pada RewardBench, malah mengatasi model proprietari seperti GPT-4o-0513 dan Gemini 1.5 Pro-0514.

Selepas pelancaran Nemotron-4-340B, platform penilaian segera mengeluarkan keputusan penanda arasnya Dapat dilihat bahawa keputusannya mengatasi Llama-3-70b dalam ujian penanda aras keras seperti Arena-Hard-Auto^.

Adakah ini bermakna model baharu yang paling berkuasa dalam industri telah muncul?

Pautan rujukan:

🎜https://blogs.nvidia.com/blog/nemotron-4-synthetic-data-generation-llm-training/🎜🎜🎜🎜🎜 //x.com/lmsysorg/status/1801682893988892716🎜🎜🎜

Atas ialah kandungan terperinci Model universal sumber terbuka paling berkuasa NVIDIA Nemotron-4 340B. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Tunjukkan Lagi

Artikel Panas

Bagaimana untuk memperbaiki KB5055612 gagal dipasang di Windows 10?

4 minggu yang lalu By DDD

<🎜>: Bubble Gum Simulator Infinity - Cara Mendapatkan dan Menggunakan Kekunci Diraja

4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

<🎜>: Tumbuh Taman - Panduan Mutasi Lengkap

3 minggu yang lalu By DDD

Nordhold: Sistem Fusion, dijelaskan

4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Mandragora: Whispers of the Witch Tree - Cara Membuka Kunci Cangkuk Bergelut

3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Tunjukkan Lagi

Alat panas

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Tunjukkan Lagi

Topik panas

Tutorial Java

1670

Tutorial CakePHP

1428

Tutorial Laravel

1329

Tutorial PHP

1276

Tutorial C#

1256

Tunjukkan Lagi

Related knowledge

Robot DeepMind bermain pingpong, dan pukulan depan dan pukulan kilasnya tergelincir ke udara, mengalahkan manusia pemula sepenuhnya Aug 09, 2024 pm 04:01 PM

Tetapi mungkin dia tidak dapat mengalahkan lelaki tua di taman itu? Sukan Olimpik Paris sedang rancak berlangsung, dan pingpong telah menarik perhatian ramai. Pada masa yang sama, robot juga telah membuat penemuan baru dalam bermain pingpong. Sebentar tadi, DeepMind mencadangkan ejen robot pembelajaran pertama yang boleh mencapai tahap pemain amatur manusia dalam pingpong yang kompetitif. Alamat kertas: https://arxiv.org/pdf/2408.03906 Sejauh manakah robot DeepMind bermain pingpong? Mungkin setanding dengan pemain amatur manusia: kedua-dua pukulan depan dan pukulan kilas: pihak lawan menggunakan pelbagai gaya permainan, dan robot juga boleh bertahan: servis menerima dengan putaran yang berbeza: Walau bagaimanapun, keamatan permainan nampaknya tidak begitu sengit seperti lelaki tua di taman itu. Untuk robot, pingpong

Cakar mekanikal pertama! Yuanluobao muncul di Persidangan Robot Dunia 2024 dan mengeluarkan robot catur pertama yang boleh memasuki rumah Aug 21, 2024 pm 07:33 PM

Pada 21 Ogos, Persidangan Robot Dunia 2024 telah diadakan dengan megah di Beijing. Jenama robot rumah SenseTime "Yuanluobot SenseRobot" telah memperkenalkan seluruh keluarga produknya, dan baru-baru ini mengeluarkan robot permainan catur AI Yuanluobot - Edisi Profesional Catur (selepas ini dirujuk sebagai "Yuanluobot SenseRobot"), menjadi robot catur A pertama di dunia untuk rumah. Sebagai produk robot permainan catur ketiga Yuanluobo, robot Guoxiang baharu telah melalui sejumlah besar peningkatan teknikal khas dan inovasi dalam AI dan jentera kejuruteraan Buat pertama kalinya, ia telah menyedari keupayaan untuk mengambil buah catur tiga dimensi melalui cakar mekanikal pada robot rumah, dan melaksanakan Fungsi mesin manusia seperti bermain catur, semua orang bermain catur, semakan notasi, dsb.

Claude pun dah jadi malas! Netizen: Belajar untuk memberi percutian kepada diri sendiri Sep 02, 2024 pm 01:56 PM

Permulaan sekolah akan bermula, dan bukan hanya pelajar yang akan memulakan semester baharu yang harus menjaga diri mereka sendiri, tetapi juga model AI yang besar. Beberapa ketika dahulu, Reddit dipenuhi oleh netizen yang mengadu Claude semakin malas. "Tahapnya telah banyak menurun, ia sering berhenti seketika, malah output menjadi sangat singkat. Pada minggu pertama keluaran, ia boleh menterjemah dokumen penuh 4 halaman sekaligus, tetapi kini ia tidak dapat mengeluarkan separuh halaman pun. !" https:// www.reddit.com/r/ClaudeAI/comments/1by8rw8/something_just_feels_wrong_with_claude_in_the/ dalam siaran bertajuk "Totally disappointed with Claude", penuh dengan

Pada Persidangan Robot Sedunia, robot domestik yang membawa 'harapan penjagaan warga tua masa depan' ini telah dikepung Aug 22, 2024 pm 10:35 PM

Pada Persidangan Robot Dunia yang diadakan di Beijing, paparan robot humanoid telah menjadi tumpuan mutlak di gerai Stardust Intelligent, pembantu robot AI S1 mempersembahkan tiga persembahan utama dulcimer, seni mempertahankan diri dan kaligrafi dalam. satu kawasan pameran, berkebolehan kedua-dua sastera dan seni mempertahankan diri, menarik sejumlah besar khalayak profesional dan media. Permainan elegan pada rentetan elastik membolehkan S1 menunjukkan operasi halus dan kawalan mutlak dengan kelajuan, kekuatan dan ketepatan. CCTV News menjalankan laporan khas mengenai pembelajaran tiruan dan kawalan pintar di sebalik "Kaligrafi Pengasas Syarikat Lai Jie menjelaskan bahawa di sebalik pergerakan sutera, bahagian perkakasan mengejar kawalan daya terbaik dan penunjuk badan yang paling menyerupai manusia (kelajuan, beban). dll.), tetapi di sisi AI, data pergerakan sebenar orang dikumpulkan, membolehkan robot menjadi lebih kuat apabila ia menghadapi situasi yang kuat dan belajar untuk berkembang dengan cepat. Dan tangkas

Nvidia bermain dengan pemangkasan dan penyulingan: mengurangkan separuh parameter Llama 3.1 8B untuk mencapai prestasi yang lebih baik dengan saiz yang sama Aug 16, 2024 pm 04:42 PM

Kebangkitan model kecil. Bulan lepas, Meta mengeluarkan siri model Llama3.1, yang merangkumi model terbesar Meta setakat ini, model 405B, dan dua model yang lebih kecil dengan 70 bilion dan 8 bilion parameter masing-masing. Llama3.1 dianggap sebagai permulaan era baharu sumber terbuka. Walau bagaimanapun, walaupun model generasi baharu berkuasa dalam prestasi, ia masih memerlukan sejumlah besar sumber pengkomputeran apabila digunakan. Oleh itu, trend lain telah muncul dalam industri, iaitu membangunkan model bahasa kecil (SLM) yang berprestasi cukup baik dalam banyak tugas bahasa dan juga sangat murah untuk digunakan. Baru-baru ini, penyelidikan NVIDIA telah menunjukkan bahawa pemangkasan berat berstruktur digabungkan dengan penyulingan pengetahuan secara beransur-ansur boleh memperoleh model bahasa yang lebih kecil daripada model yang pada mulanya lebih besar. Pemenang Anugerah Turing, Ketua Meta A

Anugerah ACL 2024 Diumumkan: Salah satu Kertas Terbaik mengenai Pentafsiran Oracle oleh HuaTech, Anugerah Ujian Masa GloVe Aug 15, 2024 pm 04:37 PM

Pada persidangan ACL ini, para penyumbang telah mendapat banyak keuntungan. ACL2024 selama enam hari diadakan di Bangkok, Thailand. ACL ialah persidangan antarabangsa teratas dalam bidang linguistik pengiraan dan pemprosesan bahasa semula jadi Ia dianjurkan oleh Persatuan Antarabangsa untuk Linguistik Pengiraan dan diadakan setiap tahun. ACL sentiasa menduduki tempat pertama dalam pengaruh akademik dalam bidang NLP, dan ia juga merupakan persidangan yang disyorkan CCF-A. Persidangan ACL tahun ini adalah yang ke-62 dan telah menerima lebih daripada 400 karya termaju dalam bidang NLP. Petang semalam, persidangan itu mengumumkan kertas kerja terbaik dan anugerah lain. Kali ini, terdapat 7 Anugerah Kertas Terbaik (dua tidak diterbitkan), 1 Anugerah Kertas Tema Terbaik, dan 35 Anugerah Kertas Cemerlang. Persidangan itu turut menganugerahkan 3 Anugerah Kertas Sumber (ResourceAward) dan Anugerah Impak Sosial (

Pasukan Li Feifei mencadangkan ReKep untuk memberi robot kecerdasan spatial dan mengintegrasikan GPT-4o Sep 03, 2024 pm 05:18 PM

Penyepaduan mendalam penglihatan dan pembelajaran robot. Apabila dua tangan robot bekerja bersama-sama dengan lancar untuk melipat pakaian, menuang teh dan mengemas kasut, ditambah pula dengan 1X robot humanoid NEO yang telah menjadi tajuk berita baru-baru ini, anda mungkin mempunyai perasaan: kita seolah-olah memasuki zaman robot. Malah, pergerakan sutera ini adalah hasil teknologi robotik canggih + reka bentuk bingkai yang indah + model besar berbilang modal. Kami tahu bahawa robot yang berguna sering memerlukan interaksi yang kompleks dan indah dengan alam sekitar, dan persekitaran boleh diwakili sebagai kekangan dalam domain spatial dan temporal. Sebagai contoh, jika anda ingin robot menuang teh, robot terlebih dahulu perlu menggenggam pemegang teko dan memastikannya tegak tanpa menumpahkan teh, kemudian gerakkannya dengan lancar sehingga mulut periuk sejajar dengan mulut cawan. , dan kemudian condongkan teko pada sudut tertentu. ini

Persidangan Kecerdasan Buatan Teragih DAI 2024 Call for Papers: Hari Agen, Richard Sutton, bapa pembelajaran pengukuhan, akan hadir! Yan Shuicheng, Sergey Levine dan saintis DeepMind akan memberikan ucaptama Aug 22, 2024 pm 08:02 PM

Pengenalan Persidangan Dengan perkembangan pesat sains dan teknologi, kecerdasan buatan telah menjadi kuasa penting dalam menggalakkan kemajuan sosial. Dalam era ini, kami bertuah untuk menyaksikan dan mengambil bahagian dalam inovasi dan aplikasi Kecerdasan Buatan Teragih (DAI). Kecerdasan buatan yang diedarkan adalah cabang penting dalam bidang kecerdasan buatan, yang telah menarik lebih banyak perhatian dalam beberapa tahun kebelakangan ini. Agen berdasarkan model bahasa besar (LLM) tiba-tiba muncul Dengan menggabungkan pemahaman bahasa yang kuat dan keupayaan penjanaan model besar, mereka telah menunjukkan potensi besar dalam interaksi bahasa semula jadi, penaakulan pengetahuan, perancangan tugas, dsb. AIAgent mengambil alih model bahasa besar dan telah menjadi topik hangat dalam kalangan AI semasa. Au

See all articles