Jadual Kandungan

Fungsi asas pemprosesan data adalah untuk meningkatkan kepelbagaian sampel data dengan cekap tanpa meningkatkan kos pelabelan kerana kos pelabelan data selalunya terlalu mahal, Sesetengah institusi pembangunan tidak mampu ia, yang juga menonjolkan kepentingan penyelidikan dalam bidang berpusatkan data pada masa yang sama, pemprosesan data juga memberi tumpuan kepada meningkatkan kecekapan pemuatan selari sampel data.

Latihan cekap berpusatkan model

Pembelajaran cekap berpaksikan pengoptimuman

Latihan yang berpusatkan sistem dan cekap

Kesimpulan

Rumah

Peranti teknologi

Latihan model besar memberi perhatian kepada 'tenaga'! Tao Dacheng mengetuai pasukan: Semua penyelesaian 'latihan yang cekap' diliputi dalam satu artikel, berhenti mengatakan bahawa perkakasan adalah satu-satunya halangan

Latihan model besar memberi perhatian kepada 'tenaga'! Tao Dacheng mengetuai pasukan: Semua penyelesaian 'latihan yang cekap' diliputi dalam satu artikel, berhenti mengatakan bahawa perkakasan adalah satu-satunya halangan

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

May 23, 2023 pm 05:04 PM

Model kereta api

Bidang pembelajaran mendalam telah mencapai kemajuan yang ketara, terutamanya dalam penglihatan komputer, pemprosesan bahasa semula jadi dan model berskala besar yang dilatih menggunakan data besar adalah penting untuk aplikasi praktikal, meningkatkan produktiviti industri dan menggalakkan pembangunan masyarakat prospek yang besar.

Latihan model besar memberi perhatian kepada tenaga! Tao Dacheng mengetuai pasukan: Semua penyelesaian latihan yang cekap diliputi dalam satu artikel, berhenti mengatakan bahawa perkakasan adalah satu-satunya halangan

Walau bagaimanapun, model besar juga memerlukan banyak kuasa pengkomputeran untuk melatih kerana keperluan orang ramai untuk kuasa pengkomputeran terus meningkat , ,Walaupun terdapat banyak kajian yang meneroka ,kaedah latihan yang cekap, masih belum ada kajian yang komprehensif ,kajian tentang teknik pecutan model pembelajaran mendalam.

Baru-baru ini, penyelidik dari Universiti Sydney, Universiti Sains dan Teknologi China dan institusi lain menerbitkan ulasan, meringkaskan secara menyeluruh teknik latihan yang cekap untuk model pembelajaran mendalam berskala besar dan menunjukkan proses latihan Mekanisme biasa dalam setiap komponen dalam.

Pautan kertas: https://arxiv.org/pdf/2304.03589.pdf

Para penyelidik menganggap formula kemas kini berat yang paling asas dan membahagikan komponen asasnya kepada lima aspek utama:

1. Berpusatkan data , termasuk penyelarasan set data, pensampelan data dan teknologi pembelajaran kursus berpusatkan data, boleh Mengurangkan kerumitan pengiraan sampel data dengan ketara

2, model-centric (model-centric) , termasuk pecutan modul asas, latihan mampatan, permulaan model dan teknologi pembelajaran kursus berpusatkan Model memfokuskan pada latihan mempercepatkan dengan mengurangkan pengiraan parameter;

3. Pengoptimuman-berpusatkan , termasuk Pemilihan kadar pembelajaran, penggunaan saiz kelompok besar, reka bentuk fungsi objektif yang cekap, teknologi purata wajaran model, dsb.; fokus pada strategi latihan untuk meningkatkan fleksibiliti model berskala besar;

5, system-centric (system-centric) , termasuk beberapa rangka kerja teragih yang cekap dan perpustakaan sumber terbuka, menyediakan sokongan perkakasan yang mencukupi untuk pelaksanaan algoritma dipercepatkan.

Latihan berpusatkan data yang cekap

Baru-baru ini, model berskala besar telah mencapai kemajuan yang besar, manakala keperluan mereka pada set data telah meningkat secara mendadak. Sampel data yang besar digunakan untuk memacu proses latihan dan mencapai prestasi cemerlang. Oleh itu, penyelidikan berpusatkan data adalah penting untuk pecutan sebenar.

Fungsi asas pemprosesan data adalah untuk meningkatkan kepelbagaian sampel data dengan cekap tanpa meningkatkan kos pelabelan kerana kos pelabelan data selalunya terlalu mahal, Sesetengah institusi pembangunan tidak mampu ia, yang juga menonjolkan kepentingan penyelidikan dalam bidang berpusatkan data pada masa yang sama, pemprosesan data juga memberi tumpuan kepada meningkatkan kecekapan pemuatan selari sampel data.

Para penyelidik memanggil semua pemprosesan data yang cekap ini sebagai pendekatan "berpusatkan data", yang boleh meningkatkan prestasi latihan model berskala besar dengan ketara.

Artikel ini menyemak dan mengkaji teknologi dari aspek berikut:

Penyaturan Data

Penyaturan data ialah teknik prapemprosesan yang meningkatkan kepelbagaian sampel data asal melalui satu siri transformasi data, yang boleh meningkatkan kesetaraan sampel latihan dalam ruang ciri Menunjukkan bahawa tiada maklumat pelabelan tambahan diperlukan.

Kaedah penyusunan data yang cekap digunakan secara meluas dalam proses latihan dan boleh meningkatkan prestasi generalisasi model berskala besar dengan ketara.

Pensampelan data Pensampelan data

Pensampelan data juga merupakan kaedah yang berkesan, daripada Memilih subset daripada kumpulan besar sampel untuk mengemas kini kecerunan mempunyai kelebihan latihan dalam kelompok kecil untuk mengurangkan kesan sampel yang tidak penting atau buruk dalam kumpulan semasa.

Biasanya, data sampel adalah lebih penting, dan prestasi adalah setara dengan model yang dilatih menggunakan kumpulan penuh kebarangkalian setiap lelaran perlu diselaraskan secara beransur-ansur bersama dengan proses latihan . untuk memastikan tiada bias dalam persampelan.

Pembelajaran Kurikulum berpusatkan data

Pembelajaran kurikulum pada peringkat berlainan proses latihan Menyiasat tetapan latihan progresif untuk mengurangkan kos pengiraan keseluruhan.

Pada mulanya, gunakan set data berkualiti rendah untuk melatih cukup untuk mempelajari ciri peringkat rendah kemudian gunakan set data berkualiti tinggi (lebih banyak peningkatan dan kaedah pra-pemprosesan yang kompleks) Secara beransur-ansur membantu mempelajari ciri yang kompleks dan mencapai ketepatan yang sama seperti menggunakan keseluruhan set latihan.

Latihan cekap berpusatkan model

Mereka bentuk seni bina model yang cekap sentiasa menjadi salah satu bidang penyelidikan yang paling penting dalam bidang pembelajaran mendalam yang cekap. Pengekstrak ciri yang boleh diunjurkan ke dalam ciri tahap tinggi yang mudah dipisahkan.

Berbeza daripada karya lain yang memberi perhatian khusus kepada seni bina model yang cekap dan novel, kertas kerja ini memberi lebih perhatian kepada alternatif yang setara dengan modul biasa dalam penyelidikan "berpusatkan model" Mencapai kecekapan latihan yang lebih tinggi dalam keadaan yang setanding.

Hampir semua model berskala besar terdiri daripada modul atau lapisan kecil, jadi penyiasatan model boleh memberi panduan untuk latihan yang cekap bagi model berskala besar. Penyelidik tertumpu terutamanya pada Penyelidikan berikut mengenai aspek:

Kecekapan Seni Bina

Dengan bilangan parameter dalam model dalam Peningkatan mendadak juga telah membawa penggunaan pengiraan yang besar, jadi ia adalah perlu untuk melaksanakan alternatif yang cekap untuk menganggarkan prestasi versi asal seni bina model ini secara beransur-ansur telah menarik perhatian komuniti akademik penggantian ini pengiraan berangka Penghampiran, juga termasuk penyederhanaan struktur dan gabungan dalam model dalam.

Para penyelidik membezakan teknik pecutan sedia ada berdasarkan seni bina yang berbeza dan membentangkan beberapa pemerhatian dan kesimpulan.

Kecekapan Latihan Mampatan

Mampatan sentiasa menjadi hala tuju penyelidikan dalam pengiraan pecutan Satu , memainkan peranan penting dalam pemprosesan isyarat digital (pengkomputeran multimedia/pemprosesan imej).

Mampatan tradisional merangkumi dua cabang utama: kuantisasi dan jarang artikel ini memperincikan pencapaian sedia ada dan sumbangan mereka kepada latihan mendalam.

Kecekapan Permulaan

Inisialisasi parameter model dalam analisis teori sedia ada Ia adalah sangat faktor penting dalam senario praktikal.

Keadaan permulaan yang buruk malah boleh menyebabkan keseluruhan latihan ranap dan terbantut dalam fasa latihan awal, manakala keadaan permulaan yang baik membantu mempercepatkan dalam julat kehilangan yang lancar Berkenaan keseluruhan kelajuan penumpuan , artikel ini terutamanya mengkaji penilaian dan reka bentuk algoritma dari perspektif permulaan model.

Pembelajaran Kurikulum Berpusatkan Model

Dari perspektif berpusatkan model, pembelajaran kursus biasanya memulakan latihan daripada model kecil atau parameter separa dalam model berskala besar, dan kemudian pulih secara beransur-ansur kepada keseluruhan seni bina dalam proses latihan yang dipercepatkan, Kelebihan yang lebih besar; , dan tiada kesan negatif yang jelas, artikel itu mengkaji pelaksanaan dan kecekapan kaedah ini dalam proses latihan.

Pembelajaran cekap berpaksikan pengoptimuman

Skim pecutan kaedah pengoptimuman sentiasa menjadi hala tuju penyelidikan penting dalam bidang pembelajaran mesin, yang boleh mengurangkan kerumitan sambil mencapai optimum Seks sentiasa menjadi usaha dalam bidang akademik.

Dalam beberapa tahun kebelakangan ini, kaedah pengoptimuman yang cekap dan berkuasa telah membuat penemuan penting dalam melatih rangkaian saraf dalam Sebagai pengoptimum asas yang digunakan secara meluas dalam pembelajaran mesin, pengoptimum kelas SGD telah berjaya Ia membantu secara mendalam model mencapai pelbagai aplikasi praktikal Namun, apabila masalah menjadi semakin kompleks, SGD lebih berkemungkinan jatuh ke dalam minima tempatan dan tidak boleh digeneralisasikan secara stabil.

Untuk menyelesaikan masalah ini, Adam dan variannya dicadangkan untuk memperkenalkan kebolehsuaian dalam kemas kini Pendekatan ini telah mencapai hasil yang baik dalam latihan rangkaian berskala besar, seperti Ia digunakan dalam BERT, Transformer dan model ViT.

Selain prestasi pengoptimum yang direka itu sendiri, gabungan teknik latihan dipercepatkan juga penting.

Berdasarkan perspektif pengoptimuman, penyelidik merumuskan pemikiran semasa mengenai latihan dipercepatkan ke dalam aspek berikut:

Kadar pembelajaran

Kadar pembelajaran ialah hiperparameter penting untuk pengoptimuman bukan cembung dan juga penting dalam latihan rangkaian dalam semasa, seperti Adam Kaedah penyesuaian sedemikian dan variannya mempunyai berjaya mencapai kemajuan yang luar biasa pada model mendalam.

Sesetengah strategi untuk melaraskan kadar pembelajaran berdasarkan kecerunan peringkat tinggi juga berkesan mencapai latihan dipercepatkan, dan pelaksanaan pereputan kadar pembelajaran juga akan menjejaskan prestasi latihan dalam proses tersebut.

Saiz kelompok besar Meningkatkan kecekapan latihan secara langsung boleh mengurangkan bilangan lelaran yang diperlukan untuk melengkapkan latihan zaman apabila jumlah sampel ditetapkan, memproses lebih besar; saiz kelompok adalah lebih murah daripada memproses beberapa sampel saiz kelompok kecil, kerana ia boleh Meningkatkan penggunaan memori dan mengurangkan kesesakan komunikasi.

Objektif yang cekap

ERM paling asas pada masalah pengecilan Memainkan peranan penting dalam membuat banyak tugas praktikal.

Dengan pendalaman penyelidikan pada rangkaian besar, sesetengah kerja memberi lebih perhatian kepada jurang antara pengoptimuman dan generalisasi, dan mencadangkan matlamat yang berkesan untuk mengurangkan ralat ujian menerangkan generalisasi daripada perspektif yang berbeza dan mengoptimumkannya secara bersama semasa latihan boleh mempercepatkan ketepatan ujian.

Purata berat

Purata wajaran ialah teknik praktikal yang boleh Meningkatkan fleksibiliti model, kerana purata wajaran negeri sejarah dipertimbangkan, dan terdapat satu set pekali beku atau boleh dipelajari, yang boleh mempercepatkan proses latihan. Latihan cekap belanjawan

Terdapat beberapa kerja terbaharu yang memfokuskan pada melatih model pembelajaran mendalam dengan sumber yang lebih sedikit dan mencapai ketepatan yang lebih tinggi sebanyak mungkin.

Masalah jenis ini ditakrifkan sebagai latihan belanjawan, iaitu latihan dilakukan dalam belanjawan tertentu (had ke atas kos boleh diukur) untuk mencapai prestasi model tertinggi.

Untuk mempertimbangkan sokongan perkakasan secara sistematik untuk mendekati situasi sebenar, penyelidik mentakrifkan latihan belanjawan sebagai latihan pada peranti tertentu dan masa terhad, contohnya, latihan pada pelayan pembelajaran mendalam peringkat rendah untuk satu hari , untuk mendapatkan model dengan prestasi terbaik.

Penyelidikan tentang latihan belanjawan boleh memberi penerangan tentang cara membuat resipi latihan untuk latihan belanjawan, termasuk menentukan saiz model, model Konfigurasi struktur, susunan kadar pembelajaran dan beberapa faktor boleh laras lain yang mempengaruhi prestasi, serta gabungan teknik latihan yang cekap sesuai untuk belanjawan yang ada, artikel ini terutamanya mengkaji beberapa teknik lanjutan latihan bajet.

Latihan yang berpusatkan sistem dan cekap

Penyelidikan berpusatkan sistem adalah untuk menyediakan kaedah pelaksanaan khusus untuk algoritma yang direka, dan untuk mengkaji keupayaan untuk benar-benar mencapai kecekapan tinggi. dan pelaksanaan praktikal perkakasan latihan.

Penyelidik menumpukan pada pelaksanaan peranti pengkomputeran umum, seperti peranti CPU dan GPU dalam kelompok berbilang nod, dan menyelesaikan konflik yang berpotensi dalam algoritma reka bentuk dari perspektif perkakasan adalah teras kebimbangan .

Artikel ini mengkaji terutamanya teknologi pelaksanaan perkakasan dalam rangka kerja sedia ada dan pustaka pihak ketiga Teknologi ini menyokong pemprosesan data, model dan pengoptimuman secara berkesan serta memperkenalkan beberapa platform sumber terbuka sedia ada. menyediakan rangka kerja yang kukuh untuk penubuhan model, penggunaan data yang berkesan untuk latihan, latihan ketepatan campuran dan latihan yang diedarkan.

Kecekapan Data Berpusatkan Sistem

Pemprosesan Data dan keselarian data yang cekap adalah dua perkara penting kebimbangan dalam pelaksanaan sistem.

Dengan peningkatan pesat dalam volum data, pemprosesan data yang tidak cekap secara beransur-ansur menjadi hambatan untuk kecekapan latihan, terutamanya untuk latihan berskala besar pada berbilang nod Reka bentuk kaedah Pengiraan yang lebih mesra perkakasan keselarian berkesan dapat mengelakkan pembaziran masa dalam latihan.

Kecekapan Model Berpusatkan Sistem

Dengan pengembangan pantas bilangan parameter model ,Dari perspektif model , kecekapan sistem telah menjadi, salah satu kesesakan yang penting, dan kecekapan penyimpanan dan pengkomputeran model berskala besar membawa cabaran besar kepada pelaksanaan perkakasan.

Artikel ini mengulas terutamanya cara untuk mencapai I/O penggunaan yang cekap dan perlaksanaan selari model yang diperkemas untuk mempercepatkan latihan sebenar.

Kecekapan Pengoptimuman berpusatkan sistem

Proses pengoptimuman mewakili Penyebaran dan kemas kini belakang juga paling banyak masa -mengambil pengiraan dalam latihan, jadi pelaksanaan pengoptimuman berpusatkan sistem secara langsung menentukan kecekapan latihan.

Untuk mentafsir dengan jelas ciri-ciri pengoptimuman sistem, artikel itu memfokuskan pada kecekapan peringkat pengiraan yang berbeza dan menyemak penambahbaikan setiap proses.

Rangka Kerja Sumber Terbuka

Rangka kerja sumber terbuka yang cekap boleh memudahkan latihan, kerana Cantuman jambatan antara reka bentuk algoritma dan sokongan perkakasan, para penyelidik meninjau pelbagai rangka kerja sumber terbuka dan menganalisis kekuatan dan kelemahan setiap reka bentuk.

Kesimpulan

Penyelidik mengkaji teknik pecutan latihan biasa untuk latihan cekap model pembelajaran mendalam berskala besar , dengan mengambil kira semua komponen dalam formula kemas kini kecerunan, meliputi keseluruhan proses latihan dalam bidang pembelajaran mendalam.

Artikel itu juga mencadangkan taksonomi baru, yang meringkaskan teknologi ini kepada lima arah utama: berpusatkan data, berpusatkan model, berpusatkan pengoptimuman, latihan belanjawan dan berpusatkan sistem .

Empat bahagian pertama terutamanya menjalankan penyelidikan komprehensif dari perspektif reka bentuk algoritma dan metodologi, manakala dalam bahagian "Latihan Cekap Berpusatkan Sistem", ia merumuskan dari perspektif inovasi paradigma dan sokongan perkakasan pelaksanaan sebenar.

Artikel menyemak dan meringkaskan teknologi yang biasa digunakan atau dibangunkan baru-baru ini yang sepadan dengan setiap bahagian, kelebihan dan tukar ganti setiap teknologi, dan membincangkan had dan arah penyelidikan masa depan yang menjanjikan ; kajian dan panduan teknikal yang komprehensif, kajian ini juga mencadangkan kejayaan semasa dan kesesakan dalam latihan yang cekap.

Para penyelidik berharap dapat membantu penyelidik mencapai pecutan latihan am dengan cekap dan memberikan beberapa implikasi yang bermakna dan menjanjikan untuk pembangunan masa depan latihan yang cekap Selain itu; kepada beberapa kemajuan yang berpotensi yang disebutkan, pandangan yang lebih luas dan menjanjikan adalah seperti berikut:

1. Carian Profil Cekap

Latihan yang cekap boleh mereka bentuk strategi carian profil pra-bina dan boleh disesuaikan untuk model dari perspektif gabungan peningkatan data, struktur model, reka bentuk pengoptimum, dll. Penyelidikan berkaitan telah mencapai beberapa kemajuan hasil.

Seni bina model baharu dan mod mampatan, tugas pra-latihan baharu dan penggunaan pengetahuan "tepi model" juga patut diterokai.

2. Penjadual Adaptif

Gunakan Penjadual berorientasikan pengoptimuman seperti kursus pembelajaran, kadar pembelajaran dan saiz kelompok, serta kerumitan model, mungkin mencapai prestasi yang lebih baik Penjadual yang sedar bajet boleh menyesuaikan diri secara dinamik dengan baki belanjawan, mengurangkan kos reka bentuk manual boleh digunakan Meneroka keselarian dan kaedah komunikasi semasa mengambil; mengambil kira senario yang lebih umum dan praktikal, seperti latihan terdesentralisasi berskala besar dalam rangkaian heterogen yang merangkumi pelbagai wilayah dan pusat data.

Atas ialah kandungan terperinci Latihan model besar memberi perhatian kepada 'tenaga'! Tao Dacheng mengetuai pasukan: Semua penyelesaian 'latihan yang cekap' diliputi dalam satu artikel, berhenti mengatakan bahawa perkakasan adalah satu-satunya halangan. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

Menjana ai hentai secara percuma.

Tunjukkan Lagi

Artikel Panas

Assassin's Creed Shadows: Penyelesaian Riddle Seashell

3 minggu yang lalu By DDD

Apa yang Baru di Windows 11 KB5054979 & Cara Memperbaiki Masalah Kemas Kini

2 minggu yang lalu By DDD

Di mana untuk mencari kad kunci kawalan kren di atomfall

3 minggu yang lalu By DDD

Penjimatan di R.E.P.O. Dijelaskan (dan simpan fail)

1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows - Cara Mencari Orang Panda

4 minggu yang lalu By DDD

Tunjukkan Lagi

Alat panas

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Tunjukkan Lagi

Topik panas

Di manakah pintu masuk log masuk untuk e-mel gmail?

7569

Tutorial CakePHP

1386

Apakah format nama akaun stim

kunci pengaktifan win11 kekal

Sambungan NYT menunjukkan dan jawapan

107

Tunjukkan Lagi

Related knowledge

Sumber terbuka! Di luar ZoeDepth! DepthFM: Anggaran kedalaman monokular yang cepat dan tepat! Apr 03, 2024 pm 12:04 PM

0. Apakah fungsi artikel ini? Kami mencadangkan DepthFM: model anggaran kedalaman monokular generatif yang serba boleh dan pantas. Sebagai tambahan kepada tugas anggaran kedalaman tradisional, DepthFM juga menunjukkan keupayaan terkini dalam tugas hiliran seperti mengecat kedalaman. DepthFM cekap dan boleh mensintesis peta kedalaman dalam beberapa langkah inferens. Mari kita baca karya ini bersama-sama ~ 1. Tajuk maklumat kertas: DepthFM: FastMonocularDepthEstimationwithFlowMatching Pengarang: MingGui, JohannesS.Fischer, UlrichPrestel, PingchuanMa, Dmytr

Model MoE sumber terbuka paling berkuasa di dunia ada di sini, dengan keupayaan bahasa Cina setanding dengan GPT-4, dan harganya hanya hampir satu peratus daripada GPT-4-Turbo May 07, 2024 pm 04:13 PM

Bayangkan model kecerdasan buatan yang bukan sahaja mempunyai keupayaan untuk mengatasi pengkomputeran tradisional, tetapi juga mencapai prestasi yang lebih cekap pada kos yang lebih rendah. Ini bukan fiksyen sains, DeepSeek-V2[1], model MoE sumber terbuka paling berkuasa di dunia ada di sini. DeepSeek-V2 ialah gabungan model bahasa pakar (MoE) yang berkuasa dengan ciri-ciri latihan ekonomi dan inferens yang cekap. Ia terdiri daripada 236B parameter, 21B daripadanya digunakan untuk mengaktifkan setiap penanda. Berbanding dengan DeepSeek67B, DeepSeek-V2 mempunyai prestasi yang lebih kukuh, sambil menjimatkan 42.5% kos latihan, mengurangkan cache KV sebanyak 93.3% dan meningkatkan daya pemprosesan penjanaan maksimum kepada 5.76 kali. DeepSeek ialah sebuah syarikat yang meneroka kecerdasan buatan am

Apr 09, 2024 am 11:52 AM

AI memang mengubah matematik. Baru-baru ini, Tao Zhexuan, yang telah mengambil perhatian terhadap isu ini, telah memajukan keluaran terbaru "Buletin Persatuan Matematik Amerika" (Buletin Persatuan Matematik Amerika). Memfokuskan pada topik "Adakah mesin akan mengubah matematik?", ramai ahli matematik menyatakan pendapat mereka Seluruh proses itu penuh dengan percikan api, tegar dan menarik. Penulis mempunyai barisan yang kuat, termasuk pemenang Fields Medal Akshay Venkatesh, ahli matematik China Zheng Lejun, saintis komputer NYU Ernest Davis dan ramai lagi sarjana terkenal dalam industri. Dunia AI telah berubah secara mendadak Anda tahu, banyak artikel ini telah dihantar setahun yang lalu.

Hello, Atlas elektrik! Robot Boston Dynamics hidup semula, gerakan pelik 180 darjah menakutkan Musk Apr 18, 2024 pm 07:58 PM

Boston Dynamics Atlas secara rasmi memasuki era robot elektrik! Semalam, Atlas hidraulik hanya "menangis" menarik diri daripada peringkat sejarah Hari ini, Boston Dynamics mengumumkan bahawa Atlas elektrik sedang berfungsi. Nampaknya dalam bidang robot humanoid komersial, Boston Dynamics berazam untuk bersaing dengan Tesla. Selepas video baharu itu dikeluarkan, ia telah pun ditonton oleh lebih sejuta orang dalam masa sepuluh jam sahaja. Orang lama pergi dan peranan baru muncul. Ini adalah keperluan sejarah. Tidak dinafikan bahawa tahun ini adalah tahun letupan robot humanoid. Netizen mengulas: Kemajuan robot telah menjadikan majlis pembukaan tahun ini kelihatan seperti manusia, dan tahap kebebasan adalah jauh lebih besar daripada manusia Tetapi adakah ini benar-benar bukan filem seram? Pada permulaan video, Atlas berbaring dengan tenang di atas tanah, seolah-olah terlentang. Apa yang berikut adalah rahang-jatuh

KAN, yang menggantikan MLP, telah diperluaskan kepada konvolusi oleh projek sumber terbuka Jun 01, 2024 pm 10:03 PM

Awal bulan ini, penyelidik dari MIT dan institusi lain mencadangkan alternatif yang sangat menjanjikan kepada MLP - KAN. KAN mengatasi MLP dari segi ketepatan dan kebolehtafsiran. Dan ia boleh mengatasi prestasi MLP berjalan dengan bilangan parameter yang lebih besar dengan bilangan parameter yang sangat kecil. Sebagai contoh, penulis menyatakan bahawa mereka menggunakan KAN untuk menghasilkan semula keputusan DeepMind dengan rangkaian yang lebih kecil dan tahap automasi yang lebih tinggi. Khususnya, MLP DeepMind mempunyai kira-kira 300,000 parameter, manakala KAN hanya mempunyai kira-kira 200 parameter. KAN mempunyai asas matematik yang kukuh seperti MLP berdasarkan teorem penghampiran universal, manakala KAN berdasarkan teorem perwakilan Kolmogorov-Arnold. Seperti yang ditunjukkan dalam rajah di bawah, KAN telah

Daya hidup kecerdasan super membangkitkan! Tetapi dengan kedatangan AI yang mengemas kini sendiri, ibu tidak perlu lagi bimbang tentang kesesakan data Apr 29, 2024 pm 06:55 PM

Saya menangis hingga mati. Dunia sedang membina model besar. Data di Internet tidak mencukupi. Model latihan kelihatan seperti "The Hunger Games", dan penyelidik AI di seluruh dunia bimbang tentang cara memberi makan data ini kepada pemakan yang rakus. Masalah ini amat ketara dalam tugas berbilang modal. Pada masa mereka mengalami kerugian, pasukan pemula dari Jabatan Universiti Renmin China menggunakan model baharu mereka sendiri untuk menjadi yang pertama di China untuk menjadikan "suapan data yang dijana model itu sendiri" menjadi kenyataan. Selain itu, ia merupakan pendekatan serampang dua mata dari segi pemahaman dan sisi penjanaan Kedua-dua pihak boleh menjana data baharu berbilang modal yang berkualiti tinggi dan memberikan maklum balas data kepada model itu sendiri. Apakah model? Awaker 1.0, model berbilang modal besar yang baru sahaja muncul di Forum Zhongguancun. Siapa pasukan itu? Enjin Sophon. Diasaskan oleh Gao Yizhao, pelajar kedoktoran di Sekolah Kecerdasan Buatan Hillhouse Universiti Renmin.

Versi Kuaishou Sora 'Ke Ling' dibuka untuk ujian: menghasilkan video lebih 120-an, memahami fizik dengan lebih baik dan boleh memodelkan pergerakan kompleks dengan tepat Jun 11, 2024 am 09:51 AM

Apa? Adakah Zootopia dibawa menjadi realiti oleh AI domestik? Didedahkan bersama-sama dengan video itu ialah model penjanaan video domestik berskala besar baharu yang dipanggil "Keling". Sora menggunakan laluan teknikal yang serupa dan menggabungkan beberapa inovasi teknologi yang dibangunkan sendiri untuk menghasilkan video yang bukan sahaja mempunyai pergerakan yang besar dan munasabah, tetapi juga mensimulasikan ciri-ciri dunia fizikal dan mempunyai keupayaan gabungan konsep dan imaginasi yang kuat. Mengikut data, Keling menyokong penjanaan video ultra panjang sehingga 2 minit pada 30fps, dengan resolusi sehingga 1080p dan menyokong berbilang nisbah aspek. Satu lagi perkara penting ialah Keling bukanlah demo atau demonstrasi hasil video yang dikeluarkan oleh makmal, tetapi aplikasi peringkat produk yang dilancarkan oleh Kuaishou, pemain terkemuka dalam bidang video pendek. Selain itu, tumpuan utama adalah untuk menjadi pragmatik, bukan untuk menulis cek kosong, dan pergi ke dalam talian sebaik sahaja ia dikeluarkan Model besar Ke Ling telah pun dikeluarkan di Kuaiying.

Robot Tesla bekerja di kilang, Musk: Tahap kebebasan tangan akan mencapai 22 tahun ini! May 06, 2024 pm 04:13 PM

Video terbaru robot Tesla Optimus dikeluarkan, dan ia sudah boleh berfungsi di kilang. Pada kelajuan biasa, ia mengisih bateri (bateri 4680 Tesla) seperti ini: Pegawai itu juga mengeluarkan rupanya pada kelajuan 20x - pada "stesen kerja" kecil, memilih dan memilih dan memilih: Kali ini ia dikeluarkan Salah satu sorotan video itu ialah Optimus menyelesaikan kerja ini di kilang, sepenuhnya secara autonomi, tanpa campur tangan manusia sepanjang proses. Dan dari perspektif Optimus, ia juga boleh mengambil dan meletakkan bateri yang bengkok, memfokuskan pada pembetulan ralat automatik: Berkenaan tangan Optimus, saintis NVIDIA Jim Fan memberikan penilaian yang tinggi: Tangan Optimus adalah robot lima jari di dunia paling cerdik. Tangannya bukan sahaja boleh disentuh

See all articles