Adakah LLM akan menjadi sejarah? bGPT sumber terbuka boleh menumbangkan paradigma pembelajaran mendalam: secara langsung mensimulasikan binari, membuka era baharu dunia digital analog!-AI-php.cn

Jadual Kandungan

Dari bait kepada segala-galanya: Memecah sempadan dan bergerak ke arah pemodelan data bersatu

Rumah

Adakah LLM akan menjadi sejarah? bGPT sumber terbuka boleh menumbangkan paradigma pembelajaran mendalam: secara langsung mensimulasikan binari, membuka era baharu dunia digital analog!

PHPz

Mar 13, 2024 pm 07:20 PM

Model kereta api emulator

Pencapaian terbaru bGPT yang dilancarkan oleh Microsoft Research Asia, model Transformer berasaskan byte ini membuka pintu baharu untuk kita meneroka dunia digital.

Tidak seperti model bahasa berasaskan perbendaharaan kata tradisional, bGPT adalah unik kerana ia boleh memproses data binari mentah secara terus tanpa dihadkan oleh format atau tugasan tertentu. Ia bertujuan untuk mensimulasikan sepenuhnya dunia digital, membuka kemungkinan baharu untuk pembangunan model.

Adakah LLM akan menjadi sejarah? bGPT sumber terbuka boleh menumbangkan paradigma pembelajaran mendalam: secara langsung mensimulasikan binari, membuka era baharu dunia digital analog!

Kertas: https://www.php.cn/link/ee88b3cea2051be97bcddf2e0d9a28f6

php. cn/link/359499f804ea7988921bf86c9377fb95

. 614c 8b42af334933e9261e53be

Dalam kertas penyelidikan mereka, pasukan penyelidik menunjukkan potensi besar bGPT untuk pemodelan. Dengan melaksanakan pemprosesan peringkat bait, bGPT bukan sahaja boleh menjana teks, imej dan audio, tetapi juga mensimulasikan tingkah laku komputer, termasuk algoritma penukaran format dan pemodelan keadaan CPU. Pendekatan merawat semua data sebagai jujukan bait ini membolehkan bGPT menyepadukan jenis data yang berbeza ke dalam rangka kerja yang sama.

Setelah dikeluarkan, kertas bGPT menyebabkan perbincangan meluas mengenai X (Twitter), menonjolkan potensi perubahan dalam model pembelajaran mendalam dan membuka kemungkinan baharu bagi model untuk benar-benar memahami dan mensimulasikan pelbagai aktiviti dalam dunia digital. Data binari: DNA asas yang membentuk dunia digitalData binari ialah asas dunia digital Ia dijalankan melalui pemproses komputer dan sistem pengendalian produk elektronik yang kami gunakan setiap hari, dan merupakan teras kepada semua data, peranti dan perisian. Oleh itu, berdasarkan asas ini, matlamat bGPT adalah untuk memahami logik dalaman sistem digital dengan mengkaji urutan data binari, dengan itu membentuk semula dan mensimulasikan pelbagai fenomena digital yang kompleks.

bGPT bukan sahaja boleh digunakan untuk penjanaan AI konvensional dan memahami tugas melalui pemprosesan peringkat bait, tetapi juga boleh mengendalikan lebih banyak aplikasi bukan tradisional. Sebagai contoh, ia boleh secara langsung mensimulasikan MIDI - format standard untuk penghantaran dan penyimpanan muzik, yang mana penyelidikan terdahulu telah mengelakkan pemodelan langsung kerana sifat perduaan MIDI.

Tetapi bGPT sememangnya sesuai untuk tugasan sedemikian dan boleh mensimulasikan algoritma penukaran data muzik dengan tepat, mencapai kadar ralat yang sangat rendah (0.0011 BPB) apabila menukar tatatanda ABC kepada format MIDI.

Dalam aplikasi praktikal, bGPT biasanya dapat melengkapkan penukaran antara simbol ABC dan fail MIDI dengan tepat, malah kadangkala boleh membetulkan ralat dalam fail asal untuk menjadikan penukaran muzik lebih tepat.

bGPT secara automatik menukar tatatanda ABC ke dalam format MIDI (di atas Perbandingan dengan data MIDI asal (di bawah) menyerlahkan perbezaan utama: walaupun data MIDI asal tiada Satu rentak (lihat gambar). ), menyebabkan iringan kord terputus, tetapi hasil yang ditukar oleh bGPT (lihat gambar di atas) mengisi jurang ini dengan betul, memastikan kelancaran iringan kord.

Pasukan penyelidik juga menganggap pemodelan CPU sebagai tugas perwakilan simulasi tingkah laku perkakasan: tugas ini memerlukan model menerima urutan arahan mesin peringkat rendah sebagai input, dan matlamatnya adalah untuk meramalkan dengan tepat bagaimana keadaan CPU dikemas kini selepas setiap arahan dilaksanakan sehingga program berhenti .

Adakah LLM akan menjadi sejarah? bGPT sumber terbuka boleh menumbangkan paradigma pembelajaran mendalam: secara langsung mensimulasikan binari, membuka era baharu dunia digital analog!

Dalam tugasan ini, bGPT menunjukkan ketepatan lebih 99.99%, menunjukkan kuasa dan kebolehskalaan model bait dalam memproses data binari asli.

Memandangkan program dan keadaan CPU awal, bGPT dapat meramal dengan tepat proses lengkap pelaksanaan CPU sehingga penamatan program. Dalam contoh ini, bGPT mengendalikan semua arahan CPU dengan tepat. Untuk memudahkan pemahaman, jujukan bait sebenar ditukar kepada format yang lebih mudah dibaca.

Dari bait kepada segala-galanya: Memecah sempadan dan bergerak ke arah pemodelan data bersatu

bGPT bukan sahaja boleh memproses data binari asli, tetapi juga menyepadukan berbilang jenis data ke dalam seni bina model bersatu, memperlakukan semua data sebagai jujukan Byte.

Pendekatan ini bukan sahaja memudahkan proses pemodelan data, tetapi juga menjadikan penyepaduan daripada mana-mana sumber data menjadi mudah tanpa perlu menyesuaikan model untuk jenis data tertentu.

Pasukan penyelidik memberikan contoh teks tradisional, imej dan fail audio dalam kertas, menunjukkan keupayaan bGPT dalam pemodelan data bersatu. Model bGPT yang mereka latih mempunyai kira-kira 100 juta parameter.

Hasil eksperimen menunjukkan bahawa jika dibandingkan dengan model yang sama saiz dengan GPT-2 (model teks), ViT (model visual) dan AST (model audio), bGPT menunjukkan prestasi yang setanding pada jenis data yang berbeza .

bGPT berprestasi sangat baik dalam penjanaan teks. Terima kasih kepada pengekodan teks peringkat baitnya, model ini tidak bergantung pada perbendaharaan kata dan oleh itu boleh menyokong semua bahasa.

Seni bina Transformer berlapisnya, walaupun overhed pengiraan serupa dengan GPT-2, boleh menjana teks sehingga 8KB, yang jauh melebihi had panjang GPT-2. Selepas pra-latihan pada data Wikipedia, teks yang dijana oleh bGPT adalah setanding dengan GPT-2 dalam kedua-dua gaya dan tema, membuktikan keupayaannya yang berkuasa dalam penjanaan teks.

bGPT dilatih terlebih dahulu pada set data Wikipedia, dan kualiti serta ketekalan topik bagi sampel teks yang dijana adalah setanding dengan GPT-2.

bGPT boleh menjana imej dengan meramalkan bait seterusnya dalam jujukan bait imej. Model ini telah dilatih terlebih dahulu pada set data ImageNet dan imej yang dijana mempunyai resolusi 32x32 piksel.

Walaupun sukar untuk menangkap dengan tepat hubungan ruang dua dimensi imej melalui jujukan bait pada skala semasa, menghasilkan artifak dan hingar dalam imej yang dijana, tekstur dan kesan cahaya dan bayang-bayang biasanya agak tepat.

Selain itu, imej yang dijana ini boleh dinyahkodkan ke dalam fail BMP seperti biasa. Pasukan penyelidik menegaskan bahawa dengan mengembangkan skala bGPT, serupa dengan kaedah pemodelan jujukan piksel iGPT yang dibangunkan oleh OpenAI, mungkin untuk mencapai kualiti yang lebih tinggi dan penjanaan imej yang lebih realistik.

Ini ialah set imej yang dijana oleh bGPT yang dilatih terlebih dahulu pada set data ImageNet. Walaupun tekstur dan kesan pencahayaan imej secara amnya tepat, mengenal pasti objek utama dalam imej yang dijana ini boleh menjadi mencabar.

bGPT merawat data audio sebagai jujukan bait dan boleh menjana sampel audio sepanjang 1 saat dengan kadar pensampelan 8000 Hz.

Model ini telah dilatih terlebih dahulu pada set data LibriSpeech dan diperhalusi serta ditunjukkan pada set data Speech Commands v2. Sampel audio yang dijana oleh bGPT mengekalkan tahap ketepatan yang tinggi, dengan beberapa sampel hampir tidak dapat dibezakan daripada audio sebenar. Berikut ialah satu set contoh yang menunjukkan keupayaan bGPT dalam bidang penjanaan audio.

Terokai dunia digital bait dengan bGPT

Model bahasa tradisional, tidak kira betapa hebatnya model tersebut, terutamanya memfokuskan pada pemprosesan teks bahasa semula jadi. Model bGPT memecahkan had pemprosesan teks melalui mekanisme pemprosesan berasaskan bait dan membuka kategori pemprosesan data baharu.

Kemajuan ini memberikan bGPT keupayaan untuk memproses pelbagai jenis data dengan lancar termasuk teks, imej, audio, dan juga data binari asli daripada algoritma dan perkakasan, membuka jalan untuk simulasi dan pemahaman yang menyeluruh tentang dunia digital.

Walaupun bGPT telah menunjukkan keupayaan yang menarik, ia mempunyai had dari segi overhed pengiraan, seperti pada masa ini hanya boleh memproses jujukan bait sehingga 8KB pada kad grafik konvensional Bagi mereka yang perlu menjana atau memproses jumlah yang besar data, Dari segi aplikasi, terdapat batasan yang jelas. Pelan kerja masa depan akan menumpukan pada membangunkan algoritma yang lebih cekap dan memanfaatkan kemajuan dalam perkakasan, bertujuan untuk meningkatkan keupayaan untuk memproses jujukan data yang lebih besar.

Peminat teknologi di seluruh dunia telah mula menantikan potensi masa depan bGPT, daripada pengoptimuman pemangkasan rangkaian dan pembelajaran kendiri kepada keupayaan konfigurasi semula rangkaian ultra-besar Perbincangan ini menjurus kepada a visi bersama: bGPT akhirnya mungkin merealisasikan Model bersatu yang mampu memproses dan mengeluarkan semua jenis data bait, benar-benar menjadi simulator komprehensif dunia digital.

Adakah LLM akan menjadi sejarah? bGPT sumber terbuka boleh menumbangkan paradigma pembelajaran mendalam: secara langsung mensimulasikan binari, membuka era baharu dunia digital analog!

Pasukan penyelidik telah menggunakan sumber terbuka kod dan model bGPT. Ini bermakna anda boleh terus melatih bGPT pada set data anda sendiri tanpa membuat sebarang pelarasan pada seni bina model dan meneroka prospek luas model bait dalam medan digital.

Atas ialah kandungan terperinci Adakah LLM akan menjadi sejarah? bGPT sumber terbuka boleh menumbangkan paradigma pembelajaran mendalam: secara langsung mensimulasikan binari, membuka era baharu dunia digital analog!. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

Menjana ai hentai secara percuma.

Tunjukkan Lagi

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)

3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Tetapan grafik terbaik

3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Penyelesaian Riddle Seashell

2 minggu yang lalu By DDD

R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa

3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

WWE 2K25: Cara Membuka Segala -galanya Di Myrise

3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Tunjukkan Lagi

Alat panas

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Tunjukkan Lagi

Topik panas

Di manakah pintu masuk log masuk untuk e-mel gmail?

7465

Tutorial CakePHP

1376

Apakah format nama akaun stim

kunci pengaktifan win11 kekal

Sambungan NYT menunjukkan dan jawapan

Tunjukkan Lagi

Related knowledge

Pengenalan kepada cara menggunakan simulator joiplay May 04, 2024 pm 06:40 PM

Simulator jojplay ialah simulator telefon mudah alih yang sangat mudah digunakan Ia menyokong permainan komputer untuk dijalankan pada telefon mudah alih dan mempunyai keserasian yang sangat baik Beberapa pemain tidak tahu cara menggunakannya . Cara menggunakan simulator joiplay 1. Mula-mula, anda perlu memuat turun pemalam Joiplay body dan RPGM Sebaik-baiknya pasangkannya mengikut urutan pemalam badan Pakej apk boleh didapati di bar Joiplay (klik untuk mendapatkan >>>). 2. Selepas Android selesai, anda boleh menambah permainan di sudut kiri bawah. 3. Isikan nama secara santai, dan tekan CHOOSE pada executablefile untuk memilih fail game.exe permainan. 4. Ikon boleh dibiarkan kosong atau anda boleh memilih gambar kegemaran anda.

Model MoE sumber terbuka paling berkuasa di dunia ada di sini, dengan keupayaan bahasa Cina setanding dengan GPT-4, dan harganya hanya hampir satu peratus daripada GPT-4-Turbo May 07, 2024 pm 04:13 PM

Bayangkan model kecerdasan buatan yang bukan sahaja mempunyai keupayaan untuk mengatasi pengkomputeran tradisional, tetapi juga mencapai prestasi yang lebih cekap pada kos yang lebih rendah. Ini bukan fiksyen sains, DeepSeek-V2[1], model MoE sumber terbuka paling berkuasa di dunia ada di sini. DeepSeek-V2 ialah gabungan model bahasa pakar (MoE) yang berkuasa dengan ciri-ciri latihan ekonomi dan inferens yang cekap. Ia terdiri daripada 236B parameter, 21B daripadanya digunakan untuk mengaktifkan setiap penanda. Berbanding dengan DeepSeek67B, DeepSeek-V2 mempunyai prestasi yang lebih kukuh, sambil menjimatkan 42.5% kos latihan, mengurangkan cache KV sebanyak 93.3% dan meningkatkan daya pemprosesan penjanaan maksimum kepada 5.76 kali. DeepSeek ialah sebuah syarikat yang meneroka kecerdasan buatan am

KAN, yang menggantikan MLP, telah diperluaskan kepada konvolusi oleh projek sumber terbuka Jun 01, 2024 pm 10:03 PM

Awal bulan ini, penyelidik dari MIT dan institusi lain mencadangkan alternatif yang sangat menjanjikan kepada MLP - KAN. KAN mengatasi MLP dari segi ketepatan dan kebolehtafsiran. Dan ia boleh mengatasi prestasi MLP berjalan dengan bilangan parameter yang lebih besar dengan bilangan parameter yang sangat kecil. Sebagai contoh, penulis menyatakan bahawa mereka menggunakan KAN untuk menghasilkan semula keputusan DeepMind dengan rangkaian yang lebih kecil dan tahap automasi yang lebih tinggi. Khususnya, MLP DeepMind mempunyai kira-kira 300,000 parameter, manakala KAN hanya mempunyai kira-kira 200 parameter. KAN mempunyai asas matematik yang kukuh seperti MLP berdasarkan teorem penghampiran universal, manakala KAN berdasarkan teorem perwakilan Kolmogorov-Arnold. Seperti yang ditunjukkan dalam rajah di bawah, KAN telah

Panduan Simulator Hidup Semula May 07, 2024 pm 05:28 PM

Life Restart Simulator adalah permainan simulasi yang sangat menarik Permainan ini telah menjadi sangat popular baru-baru ini strategi ada? Panduan Panduan Simulator Hidup Semula Ciri-ciri Simulator Mulakan Semula Kehidupan Ini adalah permainan yang sangat kreatif di mana pemain boleh bermain mengikut idea mereka sendiri. Terdapat banyak tugas yang perlu diselesaikan setiap hari, dan anda boleh menikmati kehidupan baru di dunia maya ini. Terdapat banyak lagu dalam permainan, dan semua jenis kehidupan yang berbeza sedang menunggu untuk anda alami. Hidup Semula Simulator Kandungan Permainan Kad Lukisan Bakat: Bakat: Anda mesti memilih kotak kecil misteri untuk menjadi abadi. Pelbagai kapsul kecil tersedia untuk mengelak daripada mati di tengah jalan. Cthulhu boleh memilih

Versi Kuaishou Sora 'Ke Ling' dibuka untuk ujian: menghasilkan video lebih 120-an, memahami fizik dengan lebih baik dan boleh memodelkan pergerakan kompleks dengan tepat Jun 11, 2024 am 09:51 AM

Apa? Adakah Zootopia dibawa menjadi realiti oleh AI domestik? Didedahkan bersama-sama dengan video itu ialah model penjanaan video domestik berskala besar baharu yang dipanggil "Keling". Sora menggunakan laluan teknikal yang serupa dan menggabungkan beberapa inovasi teknologi yang dibangunkan sendiri untuk menghasilkan video yang bukan sahaja mempunyai pergerakan yang besar dan munasabah, tetapi juga mensimulasikan ciri-ciri dunia fizikal dan mempunyai keupayaan gabungan konsep dan imaginasi yang kuat. Mengikut data, Keling menyokong penjanaan video ultra panjang sehingga 2 minit pada 30fps, dengan resolusi sehingga 1080p dan menyokong berbilang nisbah aspek. Satu lagi perkara penting ialah Keling bukanlah demo atau demonstrasi hasil video yang dikeluarkan oleh makmal, tetapi aplikasi peringkat produk yang dilancarkan oleh Kuaishou, pemain terkemuka dalam bidang video pendek. Selain itu, tumpuan utama adalah untuk menjadi pragmatik, bukan untuk menulis cek kosong, dan pergi ke dalam talian sebaik sahaja ia dikeluarkan Model besar Ke Ling telah pun dikeluarkan di Kuaiying.

Tentera Udara A.S. mempamerkan jet pejuang AI pertamanya dengan profil tinggi! Menteri secara peribadi menjalankan pandu uji tanpa campur tangan semasa keseluruhan proses, dan 100,000 baris kod telah diuji selama 21 kali. May 07, 2024 pm 05:00 PM

Baru-baru ini, bulatan tentera telah terharu dengan berita: jet pejuang tentera AS kini boleh melengkapkan pertempuran udara automatik sepenuhnya menggunakan AI. Ya, baru-baru ini, jet pejuang AI tentera AS telah didedahkan buat pertama kali, mendedahkan misterinya. Nama penuh pesawat pejuang ini ialah Variable Stability Simulator Test Aircraft (VISTA). Ia diterbangkan sendiri oleh Setiausaha Tentera Udara AS untuk mensimulasikan pertempuran udara satu lawan satu. Pada 2 Mei, Setiausaha Tentera Udara A.S. Frank Kendall berlepas menggunakan X-62AVISTA di Pangkalan Tentera Udara Edwards Ambil perhatian bahawa semasa penerbangan selama satu jam, semua tindakan penerbangan telah diselesaikan secara autonomi oleh AI! Kendall berkata - "Sejak beberapa dekad yang lalu, kami telah memikirkan tentang potensi tanpa had pertempuran udara-ke-udara autonomi, tetapi ia sentiasa kelihatan di luar jangkauan." Namun kini,

Pengenalan kepada kaedah tetapan fon simulator joiplay May 09, 2024 am 08:31 AM

Simulator jojplay sebenarnya boleh menyesuaikan fon permainan, dan boleh menyelesaikan masalah kehilangan aksara dan aksara berkotak dalam teks Saya rasa ramai pemain masih tidak tahu cara mengendalikannya fon simulator jojplay. Cara menetapkan fon simulator joiplay 1. Mula-mula buka simulator joiplay, klik pada tetapan (tiga titik) di sudut kanan atas, dan cari. 2. Dalam lajur RPGMSettings, klik untuk memilih fon tersuai CustomFont dalam baris ketiga. 3. Pilih fail fon dan klik OK Berhati-hati untuk tidak mengklik ikon "Simpan" di sudut kanan bawah, jika tidak tetapan lalai akan dipulihkan. 4. Pengasas dan Quasi-Yuan aksara Cina ringkas disyorkan (sudah dalam folder permainan Fuxing dan Rebirth). joi

Robot Tesla bekerja di kilang, Musk: Tahap kebebasan tangan akan mencapai 22 tahun ini! May 06, 2024 pm 04:13 PM

Video terbaru robot Tesla Optimus dikeluarkan, dan ia sudah boleh berfungsi di kilang. Pada kelajuan biasa, ia mengisih bateri (bateri 4680 Tesla) seperti ini: Pegawai itu juga mengeluarkan rupanya pada kelajuan 20x - pada "stesen kerja" kecil, memilih dan memilih dan memilih: Kali ini ia dikeluarkan Salah satu sorotan video itu ialah Optimus menyelesaikan kerja ini di kilang, sepenuhnya secara autonomi, tanpa campur tangan manusia sepanjang proses. Dan dari perspektif Optimus, ia juga boleh mengambil dan meletakkan bateri yang bengkok, memfokuskan pada pembetulan ralat automatik: Berkenaan tangan Optimus, saintis NVIDIA Jim Fan memberikan penilaian yang tinggi: Tangan Optimus adalah robot lima jari di dunia paling cerdik. Tangannya bukan sahaja boleh disentuh

See all articles