NextEvo Kumpulan Ant membuka sepenuhnya teknologi AI Infra untuk membolehkan 'pemandu autonomi' dalam latihan model besar-AI-php.cn

Rumah

NextEvo Kumpulan Ant membuka sepenuhnya teknologi AI Infra untuk membolehkan 'pemandu autonomi' dalam latihan model besar

王林

Feb 02, 2024 am 08:39 AM

model besar industri Kumpulan Semut

Baru-baru ini, NextEvo, jabatan R&D inovasi AI bagi Ant Group, mengumumkan teknologi AI Infra sumber terbuka yang komprehensif, yang boleh meningkatkan kecekapan latihan model berskala besar. Menurut data, teknologi ini boleh meningkatkan perkadaran berkesan masa latihan kepada lebih daripada 95% dan merealisasikan automasi proses latihan. Kemajuan kejayaan ini telah menggalakkan kecekapan penyelidikan dan pembangunan AI dengan ketara.

蚂蚁集团NextEvo全面开源AI Infra技术，可实现大模型训练“自动驾驶”

Gambar: Sistem pembelajaran mendalam teragih automatik Kumpulan Ant DLRover kini sumber terbuka sepenuhnya

DLRover ialah rangka kerja teknikal yang direka untuk latihan teragih berskala besar. Dalam kebanyakan perusahaan hari ini, pekerjaan latihan sering dijalankan dalam kelompok penggunaan hibrid yang kompleks dan pelbagai. Tidak kira betapa kompleksnya persekitaran, DLRover boleh mengendalikannya dengan mudah, sama seperti memandu di kawasan yang sukar.

Perkembangan pesat teknologi model besar pada tahun 2023 telah menimbulkan pertumbuhan pesat dalam amalan kejuruteraan. Cara mengurus data dengan cekap, mengoptimumkan latihan dan kecekapan inferens, dan menggunakan sepenuhnya kuasa pengkomputeran sedia ada telah menjadi isu utama.

Untuk melengkapkan model besar dengan tahap parameter 100 bilion, seperti GPT-3, ia akan mengambil masa 32 tahun untuk berlatih sekali dengan satu kad. Oleh itu, adalah sangat penting untuk menggunakan sepenuhnya kuasa pengkomputeran semasa proses latihan. Untuk mencapai matlamat ini, terdapat dua pendekatan yang boleh diambil. Pertama, prestasi GPU yang dibeli boleh dipertingkatkan lagi untuk mencapai potensi penuhnya. Kedua, sumber pengkomputeran yang tidak tersedia sebelum ini seperti CPU dan memori boleh digunakan. Untuk mencapai matlamat ini, masalah ini boleh diselesaikan melalui platform pengkomputeran heterogen.

DLRover baru-baru ini telah menyepadukan penyelesaian Flash Checkpoint (FCP) untuk pengurusan checkpoint semasa latihan model. Kaedah pengurusan pusat pemeriksaan tradisional mempunyai masalah seperti penggunaan masa yang lama, pusat pemeriksaan frekuensi tinggi mengurangkan masa latihan yang ada, dan kerugian yang berlebihan semasa pemulihan pusat pemeriksaan frekuensi rendah. Dengan menggunakan penyelesaian baharu FCP, selepas melatih model parameter 100 bilion, masa latihan terbuang yang disebabkan oleh Checkpoint dikurangkan sebanyak kira-kira 5 kali, dan masa kegigihan dikurangkan sebanyak kira-kira 70 kali. Penambahbaikan ini meningkatkan masa latihan berkesan daripada 90% kepada 95%. Ini bermakna kecekapan latihan model DLRover telah dipertingkatkan dengan ketara.

Kami juga telah menyepadukan tiga teknologi pengoptimum baharu. Pengoptimum ialah komponen teras pembelajaran mesin dan digunakan untuk mengemas kini parameter rangkaian saraf untuk meminimumkan fungsi kehilangan. Antaranya, pengoptimum Ant's AGD (Auto-switchable optimizer with Gradient Difference of adjacent steps) adalah 1.5 kali lebih pantas daripada teknologi AdamW tradisional dalam tugasan pra-latihan model besar. AGD telah digunakan dalam pelbagai senario dalam semut dan mencapai hasil yang luar biasa, dan kertas berkaitan telah dimasukkan dalam NeurIPS '23.

蚂蚁集团NextEvo全面开源AI Infra技术，可实现大模型训练“自动驾驶”

Gambar: Dalam tugasan pra-latihan model besar, AGD boleh memecut 1.5 kali ganda berbanding AdamW

Sebagai sistem pembelajaran mendalam teragih automatik, DLRover "autonomous driving" modul fungsi Atorch, juga termasuk modul fungsi Atorch autonomi. perpustakaan sambungan latihan teragih boleh mencapai kadar penggunaan kuasa pengkomputeran sebanyak 60% dalam latihan pada tahap kilokalori ratusan bilion model parameter, membantu pembangun memerah lagi kuasa pengkomputeran perkakasan.

DLRover menggunakan konsep "ML untuk Sistem" untuk meningkatkan kecerdasan latihan teragih Ia bertujuan untuk menggunakan sistem untuk membolehkan pembangun menyingkirkan sepenuhnya kekangan peruntukan sumber dan memberi tumpuan kepada latihan model itu sendiri. Tanpa sebarang input konfigurasi sumber, DLRover masih boleh menyediakan konfigurasi sumber yang optimum untuk setiap kerja latihan.

Difahamkan bahawa Ant Group terus melabur dalam teknologi dalam bidang kecerdasan buatan Baru-baru ini, Ant Group menubuhkan jabatan penyelidikan dan pembangunan inovasi AI dalaman NextEvo, yang bertanggungjawab untuk semua penyelidikan dan pembangunan teknologi teras Ant AI, termasuk. semua kerja penyelidikan dan pembangunan model besar Bailing, yang melibatkan teknologi Teras seperti algoritma AI, kejuruteraan AI, NLP, dan AIGC, serta penyelidikan dan pembangunan teknologi serta inovasi produk dalam bidang seperti susun atur model besar berbilang modal dan digital manusia.

Pada masa yang sama, Kumpulan Ant juga telah mempercepatkan kadar sumber terbuka, mengisi jurang teknologi domestik yang berkaitan, dan menggalakkan perkembangan pesat industri kecerdasan buatan.

DLR atas alamat sumber terbuka: https://www.php.cn/link/cf372cbe6eae54c6a6dfb3ebbcdc3404

Atas ialah kandungan terperinci NextEvo Kumpulan Ant membuka sepenuhnya teknologi AI Infra untuk membolehkan 'pemandu autonomi' dalam latihan model besar. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

Menjana ai hentai secara percuma.

Tunjukkan Lagi

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)

2 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Repo: Cara menghidupkan semula rakan sepasukan

4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Hello Kitty Island Adventure: Cara mendapatkan biji gergasi

4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Berapa lama masa yang diperlukan untuk mengalahkan fiksyen berpecah?

3 minggu yang lalu By DDD

R.E.P.O. Simpan Fail Lokasi: Di manakah & bagaimana untuk melindunginya?

3 minggu yang lalu By DDD

Tunjukkan Lagi

Alat panas

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Tunjukkan Lagi

Topik panas

Di manakah pintu masuk log masuk untuk e-mel gmail?

7334

Tutorial Java

1627

Tutorial CakePHP

1352

Tutorial Laravel

1264

Tutorial PHP

1209

Tunjukkan Lagi

Related knowledge

Robot DeepMind bermain pingpong, dan pukulan depan dan pukulan kilasnya tergelincir ke udara, mengalahkan manusia pemula sepenuhnya Aug 09, 2024 pm 04:01 PM

Tetapi mungkin dia tidak dapat mengalahkan lelaki tua di taman itu? Sukan Olimpik Paris sedang rancak berlangsung, dan pingpong telah menarik perhatian ramai. Pada masa yang sama, robot juga telah membuat penemuan baru dalam bermain pingpong. Sebentar tadi, DeepMind mencadangkan ejen robot pembelajaran pertama yang boleh mencapai tahap pemain amatur manusia dalam pingpong yang kompetitif. Alamat kertas: https://arxiv.org/pdf/2408.03906 Sejauh manakah robot DeepMind bermain pingpong? Mungkin setanding dengan pemain amatur manusia: kedua-dua pukulan depan dan pukulan kilas: pihak lawan menggunakan pelbagai gaya permainan, dan robot juga boleh bertahan: servis menerima dengan putaran yang berbeza: Walau bagaimanapun, keamatan permainan nampaknya tidak begitu sengit seperti lelaki tua di taman itu. Untuk robot, pingpong

Cakar mekanikal pertama! Yuanluobao muncul di Persidangan Robot Dunia 2024 dan mengeluarkan robot catur pertama yang boleh memasuki rumah Aug 21, 2024 pm 07:33 PM

Pada 21 Ogos, Persidangan Robot Dunia 2024 telah diadakan dengan megah di Beijing. Jenama robot rumah SenseTime "Yuanluobot SenseRobot" telah memperkenalkan seluruh keluarga produknya, dan baru-baru ini mengeluarkan robot permainan catur AI Yuanluobot - Edisi Profesional Catur (selepas ini dirujuk sebagai "Yuanluobot SenseRobot"), menjadi robot catur A pertama di dunia untuk rumah. Sebagai produk robot permainan catur ketiga Yuanluobo, robot Guoxiang baharu telah melalui sejumlah besar peningkatan teknikal khas dan inovasi dalam AI dan jentera kejuruteraan Buat pertama kalinya, ia telah menyedari keupayaan untuk mengambil buah catur tiga dimensi melalui cakar mekanikal pada robot rumah, dan melaksanakan Fungsi mesin manusia seperti bermain catur, semua orang bermain catur, semakan notasi, dsb.

Claude pun dah jadi malas! Netizen: Belajar untuk memberi percutian kepada diri sendiri Sep 02, 2024 pm 01:56 PM

Permulaan sekolah akan bermula, dan bukan hanya pelajar yang akan memulakan semester baharu yang harus menjaga diri mereka sendiri, tetapi juga model AI yang besar. Beberapa ketika dahulu, Reddit dipenuhi oleh netizen yang mengadu Claude semakin malas. "Tahapnya telah banyak menurun, ia sering berhenti seketika, malah output menjadi sangat singkat. Pada minggu pertama keluaran, ia boleh menterjemah dokumen penuh 4 halaman sekaligus, tetapi kini ia tidak dapat mengeluarkan separuh halaman pun. !" https:// www.reddit.com/r/ClaudeAI/comments/1by8rw8/something_just_feels_wrong_with_claude_in_the/ dalam siaran bertajuk "Totally disappointed with Claude", penuh dengan

Pada Persidangan Robot Sedunia, robot domestik yang membawa 'harapan penjagaan warga tua masa depan' ini telah dikepung Aug 22, 2024 pm 10:35 PM

Pada Persidangan Robot Dunia yang diadakan di Beijing, paparan robot humanoid telah menjadi tumpuan mutlak di gerai Stardust Intelligent, pembantu robot AI S1 mempersembahkan tiga persembahan utama dulcimer, seni mempertahankan diri dan kaligrafi dalam. satu kawasan pameran, berkebolehan kedua-dua sastera dan seni mempertahankan diri, menarik sejumlah besar khalayak profesional dan media. Permainan elegan pada rentetan elastik membolehkan S1 menunjukkan operasi halus dan kawalan mutlak dengan kelajuan, kekuatan dan ketepatan. CCTV News menjalankan laporan khas mengenai pembelajaran tiruan dan kawalan pintar di sebalik "Kaligrafi Pengasas Syarikat Lai Jie menjelaskan bahawa di sebalik pergerakan sutera, bahagian perkakasan mengejar kawalan daya terbaik dan penunjuk badan yang paling menyerupai manusia (kelajuan, beban). dll.), tetapi di sisi AI, data pergerakan sebenar orang dikumpulkan, membolehkan robot menjadi lebih kuat apabila ia menghadapi situasi yang kuat dan belajar untuk berkembang dengan cepat. Dan tangkas

perkakasan AI menambah ahli lain! Daripada menggantikan telefon bimbit, bolehkah NotePin hidup lebih lama? Sep 02, 2024 pm 01:40 PM

Setakat ini, tiada produk dalam trek peranti boleh pakai AI telah mencapai hasil yang sangat baik. AIPin, yang dilancarkan di MWC24 pada awal tahun ini, sebaik sahaja prototaip penilaian dihantar, "mitos AI" yang digembar-gemburkan pada masa pelancarannya mula berkecai, dan ia mengalami pulangan berskala besar dalam hanya satu beberapa bulan; RabbitR1, yang juga terjual dengan baik pada mulanya, agak Lebih baik, tetapi ia juga menerima ulasan negatif serupa dengan "kes Android" apabila ia dihantar dalam kuantiti yang banyak. Kini, syarikat lain telah memasuki trek peranti boleh pakai AI. Media teknologi TheVerge menerbitkan catatan blog semalam mengatakan bahawa permulaan AI Plaud telah melancarkan produk yang dipanggil NotePin. Berbeza dengan AIFriend yang masih dalam peringkat "melukis", NotePin kini telah bermula

Pasukan Li Feifei mencadangkan ReKep untuk memberi robot kecerdasan spatial dan mengintegrasikan GPT-4o Sep 03, 2024 pm 05:18 PM

Penyepaduan mendalam penglihatan dan pembelajaran robot. Apabila dua tangan robot bekerja bersama-sama dengan lancar untuk melipat pakaian, menuang teh dan mengemas kasut, ditambah pula dengan 1X robot humanoid NEO yang telah menjadi tajuk berita baru-baru ini, anda mungkin mempunyai perasaan: kita seolah-olah memasuki zaman robot. Malah, pergerakan sutera ini adalah hasil teknologi robotik canggih + reka bentuk bingkai yang indah + model besar berbilang modal. Kami tahu bahawa robot yang berguna sering memerlukan interaksi yang kompleks dan indah dengan alam sekitar, dan persekitaran boleh diwakili sebagai kekangan dalam domain spatial dan temporal. Sebagai contoh, jika anda ingin robot menuang teh, robot terlebih dahulu perlu menggenggam pemegang teko dan memastikannya tegak tanpa menumpahkan teh, kemudian gerakkannya dengan lancar sehingga mulut periuk sejajar dengan mulut cawan. , dan kemudian condongkan teko pada sudut tertentu. ini

Anugerah ACL 2024 Diumumkan: Salah satu Kertas Terbaik mengenai Pentafsiran Oracle oleh HuaTech, Anugerah Ujian Masa GloVe Aug 15, 2024 pm 04:37 PM

Pada persidangan ACL ini, para penyumbang telah mendapat banyak keuntungan. ACL2024 selama enam hari diadakan di Bangkok, Thailand. ACL ialah persidangan antarabangsa teratas dalam bidang linguistik pengiraan dan pemprosesan bahasa semula jadi Ia dianjurkan oleh Persatuan Antarabangsa untuk Linguistik Pengiraan dan diadakan setiap tahun. ACL sentiasa menduduki tempat pertama dalam pengaruh akademik dalam bidang NLP, dan ia juga merupakan persidangan yang disyorkan CCF-A. Persidangan ACL tahun ini adalah yang ke-62 dan telah menerima lebih daripada 400 karya termaju dalam bidang NLP. Petang semalam, persidangan itu mengumumkan kertas kerja terbaik dan anugerah lain. Kali ini, terdapat 7 Anugerah Kertas Terbaik (dua tidak diterbitkan), 1 Anugerah Kertas Tema Terbaik, dan 35 Anugerah Kertas Cemerlang. Persidangan itu turut menganugerahkan 3 Anugerah Kertas Sumber (ResourceAward) dan Anugerah Impak Sosial (

Hongmeng Smart Travel S9 dan persidangan pelancaran produk baharu senario penuh, beberapa produk baharu blockbuster dikeluarkan bersama-sama Aug 08, 2024 am 07:02 AM

Petang ini, Hongmeng Zhixing secara rasmi mengalu-alukan jenama baharu dan kereta baharu. Pada 6 Ogos, Huawei mengadakan persidangan pelancaran produk baharu Hongmeng Smart Xingxing S9 dan senario penuh Huawei, membawakan sedan perdana pintar panoramik Xiangjie S9, M7Pro dan Huawei novaFlip baharu, MatePad Pro 12.2 inci, MatePad Air baharu, Huawei Bisheng With banyak produk pintar semua senario baharu termasuk pencetak laser siri X1, FreeBuds6i, WATCHFIT3 dan skrin pintar S5Pro, daripada perjalanan pintar, pejabat pintar kepada pakaian pintar, Huawei terus membina ekosistem pintar senario penuh untuk membawa pengguna pengalaman pintar Internet Segala-galanya. Hongmeng Zhixing: Pemerkasaan mendalam untuk menggalakkan peningkatan industri kereta pintar Huawei berganding bahu dengan rakan industri automotif China untuk menyediakan

See all articles