Rumah Peranti teknologi AI Kemajuan cip AI yang dibangunkan sendiri oleh Meta: cip AI pertama akan dilancarkan pada 2025, serta cip AI video

Kemajuan cip AI yang dibangunkan sendiri oleh Meta: cip AI pertama akan dilancarkan pada 2025, serta cip AI video

May 29, 2023 pm 08:50 PM
ai chip kajian diri kemajuan

Berita 19 Mei, menurut media asing Techcrunch, dalam acara dalam talian pagi ini, syarikat induk Facebook Meta mendedahkan buat pertama kalinya kemajuan cip AI yang dibangunkan sendiri, yang boleh menyokong reka bentuk pengiklanan yang dilancarkan baru-baru ini dan AI Generatif. teknologi untuk alat kreatif.

Kemajuan cip AI yang dibangunkan sendiri oleh Meta: cip AI pertama akan dilancarkan pada 2025, serta cip AI video

△Ketua Pegawai Eksekutif Meta Zuckerberg mempamerkan cip AI pertama yang dibangunkan sendiri MTIA

Naib Presiden Infrastruktur Meta Alexis Bjorlin berkata: Membina keupayaan [perkakasan] kami sendiri memberi kami kawalan ke atas setiap lapisan timbunan, daripada reka bentuk pusat data kepada rangka kerja latihan. Terdapat keperluan untuk ini tahap integrasi Menegak boleh menolak sempadan penyelidikan kecerdasan buatan secara besar-besaran.”

Cip AI yang dibangunkan sendiri pertama MTIA

Sepanjang dekad yang lalu atau lebih, Meta telah membelanjakan berbilion dolar untuk merekrut saintis data terkemuka dan membina jenis kecerdasan buatan baharu, termasuk kini enjin penemuan, penapis penyederhanaan dan pengesyor iklan merentas apl dan perkhidmatannya Dikuasakan oleh kecerdasan buatan. Syarikat ini telah berusaha untuk menjadikan banyak inovasi penyelidikan AI yang bercita-cita tinggi menjadi produk, terutamanya dalam bidang AI generatif.

Sejak 2016, syarikat Internet terkemuka telah giat membangunkan cip AI awan. Google telah mereka bentuk dan menggunakan cip AI yang dibangunkan sendiri yang dipanggil Tensor Processing Units (TPU) untuk melatih sistem AI generatif seperti PaLM-2, Imagen, dsb. Amazon menyediakan pelanggan AWS dengan dua cip AI yang dibangunkan sendiri, AWS Trainium dan AWS Inferentia cip untuk aplikasi. Microsoft juga dikhabarkan akan bekerjasama dengan AMD untuk membangunkan cip AI yang dipanggil Athena.

Sebelum ini, Meta telah menggunakan gabungan CPU pihak ketiga dan cip tersuai yang direka untuk mempercepatkan algoritma AI untuk menjalankan beban kerja AInya—CPU cenderung kurang cekap berbanding GPU dalam memproses tugasan tersebut. Untuk mengubah keadaan, Meta membangunkan cip AI dibangunkan sendiri generasi pertama MTIA (MTIA v1) berdasarkan proses 7nm pada tahun 2020.

Kemajuan cip AI yang dibangunkan sendiri oleh Meta: cip AI pertama akan dilancarkan pada 2025, serta cip AI video

Meta memanggil cip AI Meta Training and Inference Accelerator, atau singkatannya MTIA, dan menerangkannya sebagai sebahagian daripada "keluarga" cip AI yang mempercepatkan latihan AI dan beban kerja inferens. MTIA ialah ASIC, cip yang menggabungkan litar berbeza pada satu substrat, membolehkan ia diprogramkan untuk melaksanakan satu atau lebih tugas secara selari.

“Untuk mencapai tahap kecekapan dan prestasi yang lebih tinggi merentas beban kerja kritikal kami, kami memerlukan penyelesaian tersuai yang direka-reka bersama dengan model, susunan perisian dan perkakasan sistem untuk menjadikan pelbagai perkhidmatan lebih cekap untuk pengguna kami pengalaman," jelas Bjorlin.

Menurut pengenalan, MTIA v1 dihasilkan menggunakan proses 7nm, dan memori 128MB dalamannya boleh dikembangkan sehingga 128GB. Meta berkata bahawa MTIA boleh digunakan khas untuk mengendalikan kerja yang berkaitan dengan sistem pengesyoran AI, membantu pengguna mencari kandungan siaran terbaik dan membentangkannya kepada pengguna dengan lebih pantas, dan prestasi pengkomputeran dan kecekapan pemprosesannya lebih baik daripada CPU. Selain itu, dalam ujian penanda aras reka bentuk Meta, MTIA juga lebih cekap daripada GPU dalam memproses model AI "kerumitan rendah" dan "kerumitan sederhana".

Meta berkata bahawa masih terdapat beberapa kerja yang perlu dilakukan dalam kawasan ingatan dan rangkaian cip MTIA Apabila skala model AI berkembang, ini akan mewujudkan kesesakan dan memerlukan beban kerja diagihkan pada berbilang cip. Baru-baru ini, Meta telah memperoleh pasukan teknologi rangkaian AI Graphcore cip unicorn British yang berpangkalan di Oslo untuk tujuan ini. Pada masa ini, MTIA lebih menumpukan pada keupayaan inferens daripada keupayaan latihan untuk "beban kerja yang disyorkan" keluarga aplikasi Meta.

Meta menekankan bahawa ia akan terus menambah baik MTIA, yang telah "dengan ketara" meningkatkan kecekapan syarikat dari segi prestasi per watt apabila menjalankan beban kerja yang disyorkan - seterusnya membenarkan Meta menjalankan "lebih dipertingkatkan" dan "terdepan" tiruan beban kerja perisikan.

Mengikut rancangan, Meta secara rasmi akan melancarkan cip MTIA yang dibangunkan sendiri pada tahun 2025.

RSC superkomputer AI Meta

Menurut laporan, Meta pada asalnya merancang untuk melancarkan cip AI tersuai yang dibangunkan sendiri secara besar-besaran pada tahun 2022, tetapi akhirnya menangguhkannya dan sebaliknya memesan GPU Nvidia bernilai berbilion dolar untuk superkomputer Research SuperCluster (RSC). yang memerlukan reka bentuk semula utama berbilang pusat datanya.

Menurut laporan, RSC memulakan kerjayanya pada Januari 2022 dan telah dipasang dengan kerjasama Penguin Computing, Nvidia dan Pure Storage, dan telah menyelesaikan fasa kedua pengembangan. Meta mengatakan ia kini mengandungi sejumlah 2,000 sistem Nvidia DGX A100, dilengkapi dengan 16,000 GPU Nvidia A100.

Walaupun, kuasa pengkomputeran semasa RSC telah ketinggalan berbanding superkomputer AI Microsoft dan Google. Google mendakwa superkomputer tertumpu AI dikuasakan oleh 26,000 GPU Nvidia H100. Meta menyatakan bahawa kelebihan RSC ialah ia membolehkan penyelidik melatih model menggunakan contoh sebenar daripada sistem pengeluaran Meta. Tidak seperti infrastruktur AI syarikat sebelum ini, yang memanfaatkan sumber terbuka dan set data yang tersedia secara umum, infrastruktur ini kini tersedia.

Superkomputer AI RSC sedang memajukan penyelidikan AI dalam pelbagai bidang, termasuk AI generatif, menolak sempadan penyelidikan. "Ini benar-benar mengenai produktiviti penyelidikan AI," kata jurucakap Meta. Kami mahu menyediakan penyelidik AI dengan infrastruktur terkini yang membolehkan mereka membangunkan model dan menyediakan mereka dengan platform latihan untuk memajukan AI. ”

Meta mendakwa bahawa pada kemuncaknya, RSC boleh mencapai hampir 5 exaflop kuasa pengkomputeran, menjadikannya salah satu yang terpantas di dunia.

Meta menggunakan RSC untuk latihan LLaMA, di mana RSC merujuk kepada akronim untuk "Model Bahasa Berskala Besar Meta Artificial Intelligence". Meta mengatakan model LLaMA terbesar telah dilatih pada 2,048 GPU A100 dan mengambil masa 21 hari.

"Membina keupayaan superkomputer kami sendiri memberi kami kawalan ke atas setiap lapisan timbunan daripada reka bentuk pusat data kepada rangka kerja latihan," kata jurucakap Meta menambah: "RSC akan membantu penyelidik AI Meta membina model AI baharu dan lebih baik yang boleh belajar daripada trilion contoh; bekerja merentasi ratusan bahasa yang berbeza untuk menganalisis teks, imej dan video dengan lancar.”

Pada masa hadapan, Meta mungkin memperkenalkan MTIA cip AI yang dibangunkan sendiri ke dalam RSC untuk meningkatkan lagi prestasi AInya.

MSVP cip AI untuk pemprosesan video

Selain MTIA, Meta juga sedang membangunkan satu lagi cip AI yang dipanggil Meta Scalable Video Processor (MSVP), yang direka terutamanya untuk memenuhi keperluan pemprosesan data yang semakin meningkat bagi video atas permintaan dan penstriman langsung yang akhirnya diharapkan oleh Meta kerja pemprosesan kandungan audio dan video yang matang dan stabil dilakukan oleh MSVP.

Malah, Meta mula memikirkan cip pemprosesan video sebelah pelayan tersuai bertahun-tahun yang lalu, dan mengumumkan pelancaran ASIC untuk kerja transkod dan inferens video pada 2019. Ini adalah kemuncak beberapa usaha tersebut dan dorongan baharu untuk kelebihan daya saing. Terutamanya dalam bidang penstriman video secara langsung.

"Di Facebook sahaja, orang menghabiskan 50% masa mereka menonton video," pengarah teknikal Meta Harikrishna Reddy dan Yunqing Chen menulis dalam catatan blog yang diterbitkan pada pagi 19: "Untuk berkhidmat kepada dunia Merentasi pelbagai peranti di mana-mana sahaja (mudah alih, komputer riba, TV, dsb.), video yang dimuat naik ke Facebook atau Instagram ditranskodkan ke dalam berbilang aliran bit dengan format pengekodan, resolusi dan kualiti yang berbeza... MSVP boleh diprogramkan dan Berskala serta boleh dikonfigurasikan untuk menyokong dengan cekap tinggi- transkod kualiti diperlukan untuk VOD serta kependaman yang rendah dan masa pemprosesan yang lebih pantas diperlukan untuk penstriman langsung ”

Kemajuan cip AI yang dibangunkan sendiri oleh Meta: cip AI pertama akan dilancarkan pada 2025, serta cip AI video

△MSVP

Meta mengatakan rancangannya adalah untuk akhirnya memuatkan kebanyakan beban kerja pemprosesan video yang "stabil dan matang" kepada MSVP dan hanya menggunakan pengekodan video perisian untuk beban kerja yang memerlukan penyesuaian khusus dan kualiti yang lebih tinggi "dengan ketara". Meta berkata kami akan terus meningkatkan kualiti video dengan MSVP menggunakan kaedah pra-pemprosesan seperti pengurangan hingar pintar dan peningkatan imej, serta kaedah pasca pemprosesan seperti penyingkiran artifak dan resolusi super.

"Pada masa hadapan, MSVP akan membolehkan kami menyokong lebih banyak kes penggunaan dan keperluan Meta yang paling penting, termasuk video pendek - membolehkan penyampaian AI generatif, AR/VR dan kandungan Metaverse lain yang cekap," kata Reddy dan Chen.

Editor: Xinzixun-Rurounijian

Atas ialah kandungan terperinci Kemajuan cip AI yang dibangunkan sendiri oleh Meta: cip AI pertama akan dilancarkan pada 2025, serta cip AI video. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Tetapan grafik terbaik
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Cara Membuka Segala -galanya Di Myrise
4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Tajuk baharu: NVIDIA H200 dikeluarkan: Kapasiti HBM meningkat sebanyak 76%, cip AI paling berkuasa yang meningkatkan prestasi model besar sebanyak 90% dengan ketara Tajuk baharu: NVIDIA H200 dikeluarkan: Kapasiti HBM meningkat sebanyak 76%, cip AI paling berkuasa yang meningkatkan prestasi model besar sebanyak 90% dengan ketara Nov 14, 2023 pm 03:21 PM

Menurut berita pada 14 November, Nvidia secara rasmi mengeluarkan GPU H200 baharu pada persidangan "Supercomputing23" pada pagi waktu tempatan ke-13, dan mengemas kini barisan produk GH200 Antaranya, H200 masih dibina pada seni bina Hopper H100 yang sedia ada Walau bagaimanapun, lebih banyak memori jalur lebar tinggi (HBM3e) telah ditambah untuk mengendalikan set data besar yang diperlukan untuk membangun dan melaksanakan kecerdasan buatan dengan lebih baik, menjadikan prestasi keseluruhan menjalankan model besar bertambah baik sebanyak 60% hingga 90% berbanding H100 generasi sebelumnya. . GH200 yang dikemas kini juga akan memberi kuasa kepada superkomputer AI generasi seterusnya. Pada tahun 2024, lebih daripada 200 exaflop kuasa pengkomputeran AI akan berada dalam talian. H200

MediaTek dikhabarkan telah memenangi tempahan besar daripada Google untuk cip AI pelayan dan akan membekalkan cip Serdes berkelajuan tinggi MediaTek dikhabarkan telah memenangi tempahan besar daripada Google untuk cip AI pelayan dan akan membekalkan cip Serdes berkelajuan tinggi Jun 19, 2023 pm 08:23 PM

Menurut laporan pada 19 Jun, menurut laporan media di Taiwan, Google (Google) telah mendekati MediaTek untuk bekerjasama bagi membangunkan cip AI berorientasikan pelayan terkini, dan merancang untuk menyerahkannya kepada proses 5nm TSMC untuk faundri, dan rancangan. untuk mengeluarkannya secara besar-besaran awal tahun depan. Menurut laporan itu, sumber mendedahkan bahawa kerjasama antara Google dan MediaTek ini akan menyediakan MediaTek dengan penyelesaian serializer dan deserializer (SerDes) dan membantu menyepadukan pemproses tensor (TPU) yang dibangunkan sendiri oleh Google untuk membantu Google mencipta cip AI Pelayan terkini akan menjadi lebih berkuasa daripada seni bina CPU atau GPU. Industri menunjukkan bahawa banyak perkhidmatan semasa Google berkaitan dengan AI Ia telah melabur dalam teknologi pembelajaran mendalam bertahun-tahun yang lalu dan mendapati bahawa menggunakan GPU untuk melakukan pengiraan AI adalah sangat mahal

Perkara besar seterusnya dalam AI: Prestasi puncak cip NVIDIA B100 dan model OpenAI GPT-5 Perkara besar seterusnya dalam AI: Prestasi puncak cip NVIDIA B100 dan model OpenAI GPT-5 Nov 18, 2023 pm 03:39 PM

Selepas kemunculan pertama NVIDIA H200, yang dikenali sebagai cip AI paling berkuasa di dunia, industri mula menantikan cip B100 NVIDIA yang lebih berkuasa Pada masa yang sama, OpenAI, syarikat permulaan AI yang paling popular tahun ini, telah bermula untuk membangunkan model GPT-5 yang lebih berkuasa dan kompleks. Guotai Junan menegaskan dalam laporan penyelidikan terbaharu bahawa B100 dan GPT5 dengan prestasi tanpa had dijangka akan dikeluarkan pada 2024, dan peningkatan besar mungkin mengeluarkan produktiviti yang belum pernah terjadi sebelumnya. Agensi itu menyatakan bahawa adalah optimis bahawa AI akan memasuki tempoh pembangunan pesat dan keterlihatannya akan berterusan sehingga 2024. Berbanding dengan produk generasi terdahulu, sejauh manakah kuasa B100 dan GPT-5? NVIDIA dan OpenAI telah pun memberikan pratonton: B100 mungkin lebih daripada 4 kali lebih pantas daripada H100, dan GPT-5 mungkin mencapai prestasi hebat

Menurut khabar angin dalam talian, vivo akan melancarkan model AI yang dibangunkan sendiri yang besar: serupa dengan Microsoft Menurut khabar angin dalam talian, vivo akan melancarkan model AI yang dibangunkan sendiri yang besar: serupa dengan Microsoft Oct 17, 2023 pm 05:57 PM

Vivo secara rasmi mengumumkan bahawa ia akan mengadakan Persidangan Pembangun 2023 dengan tema "Bersama Bersama" di Pusat Konvensyen dan Pameran Antarabangsa Shenzhen pada 1 November 2023. Ia akan mengeluarkan model AI yang dibangunkan sendiri yang besar, operasi yang dibangunkan sendiri. sistem, dan sistem OriginOS4 . Baru-baru ini, blogger digital terkenal "Digital Chat Station" mengumumkan bahawa model besar AI yang dibangunkan sendiri oleh vivo akan dilancarkan pada OriginOS4, serupa dengan Microsoft Copilot, dengan tetingkap terapung yang berasingan dipanggil keluar dari bar sisi, dan mod bersepadu ke dalam pembantu suara Ia tidak sama Jumlah data AI dan integrasi sistem dilakukan dengan baik, dan semua pekerja mempunyai sistem pintar. Berdasarkan gambar, model besar AI yang dibangunkan sendiri oleh vivo akan dinamakan "JoviCopilot". Khabarnya JoviCopilot boleh

Pendedahan secara mendalam: Rahsia di sebalik pembangunan ISP kamera Apple sendiri! Pendedahan secara mendalam: Rahsia di sebalik pembangunan ISP kamera Apple sendiri! Nov 11, 2023 pm 02:45 PM

Menurut berita pada 11 November, baru-baru ini, pihak berkuasa dalam bidang cip telefon bimbit, @手机 Chip Daren, mendedahkan dalam Weibo terbarunya bahawa Apple tidak lama lagi akan melancarkan dua cip siri M3 baharu untuk mengukuhkan lagi kekuatan teknikalnya dalam bidang mudah alih. cip peranti. Kedua-dua cip ini akan menggunakan teknologi 3nm termaju untuk membawa pengguna prestasi yang lebih cemerlang dan kecekapan tenaga. Butiran mengenai kedua-dua cip ini masih misteri. Bagaimanapun, menurut pakar cip telefon bimbit, cip keempat siri M3 dinamakan M3 Ultra dan akan menggunakan teknologi "UltraFusion" termaju. Ciri teknologi ini ialah dua cip M3Max disambung dengan bijak untuk menyediakan peranti dengan kuasa pengkomputeran yang lebih berkuasa dan kelajuan pemprosesan. Bagi teras siri M3 kelima

Kneron melancarkan cip AI terkini KL730 untuk memacu aplikasi berskala besar bagi penyelesaian GPT ringan Kneron melancarkan cip AI terkini KL730 untuk memacu aplikasi berskala besar bagi penyelesaian GPT ringan Aug 17, 2023 pm 01:37 PM

Kemajuan KL730 dalam kecekapan tenaga telah menyelesaikan kesesakan terbesar dalam pelaksanaan model kecerdasan buatan - kos tenaga Berbanding dengan industri dan cip Nerner sebelumnya, cip KL730 telah meningkat sebanyak 3 hingga 4 kali ganda cip KL730 menyokong yang paling maju model Bahasa berskala besar GPT ringan, seperti nanoGPT, dan memberikan kuasa pengkomputeran berkesan 0.35-4 tera sesaat syarikat AI Kneron hari ini mengumumkan keluaran cip KL730, yang menyepadukan NPU gred automotif dan pemprosesan isyarat imej (ISP). untuk membawa AI yang selamat dan bertenaga rendah Keupayaan diperkasakan dalam pelbagai senario aplikasi seperti pelayan tepi, rumah pintar dan sistem pemanduan bantuan automotif. Kneron yang berpangkalan di San Diego terkenal dengan unit pemprosesan saraf (NPU) yang terobosan, dan cip terbarunya, KL730, bertujuan untuk mencapai

NVIDIA melancarkan cip AI baharu H200, prestasi dipertingkatkan sebanyak 90%! Kuasa pengkomputeran China mencapai kejayaan bebas! NVIDIA melancarkan cip AI baharu H200, prestasi dipertingkatkan sebanyak 90%! Kuasa pengkomputeran China mencapai kejayaan bebas! Nov 14, 2023 pm 05:37 PM

Walaupun dunia masih terobsesi dengan cip NVIDIA H100 dan membelinya secara gila-gila untuk memenuhi permintaan yang semakin meningkat untuk kuasa pengkomputeran AI, pada hari Isnin waktu tempatan, NVIDIA secara senyap-senyap melancarkan cip AI terbarunya H200, yang digunakan untuk melatih model AI besar Berbanding dengan yang lain Prestasi produk generasi terdahulu H100 dan H200 telah dipertingkatkan kira-kira 60% hingga 90%. H200 ialah versi dinaik taraf bagi Nvidia H100 Ia juga berdasarkan seni bina Hopper seperti H100 Peningkatan utama termasuk 141GB memori video HBM3e, dan lebar jalur memori video telah meningkat daripada 3.35TB/s bagi H100. TB/s. Menurut laman web rasmi Nvidia, H200 juga merupakan cip pertama syarikat yang menggunakan memori HBM3e Memori ini lebih pantas dan mempunyai kapasiti yang lebih besar, jadi ia lebih sesuai untuk bahasa besar.

Kneron mengumumkan pelancaran cip AI terbarunya KL730 Kneron mengumumkan pelancaran cip AI terbarunya KL730 Aug 17, 2023 am 10:09 AM

Menurut perkataan asal, ia boleh ditulis semula sebagai: (Global TMT 16 Ogos 2023) Syarikat AI Kneron, yang beribu pejabat di San Diego dan terkenal dengan unit pemprosesan saraf (NPU) yang terobosan, mengumumkan pengeluaran cip KL730. Cip ini menyepadukan NPU gred automotif dan pemprosesan isyarat imej (ISP), dan menyediakan keupayaan AI yang selamat dan bertenaga rendah kepada pelbagai senario aplikasi seperti pelayan tepi, rumah pintar dan sistem pemanduan berbantukan automotif. Cip KL730 telah mencapai hasil yang hebat segi kecekapan tenaga. Satu kejayaan, berbanding dengan cip Nerner sebelumnya, kecekapan tenaganya telah meningkat sebanyak 3 hingga 4 kali ganda, dan 150% hingga 200% lebih tinggi daripada produk serupa dalam industri utama. Cip ini mempunyai kuasa pengkomputeran berkesan 0.35-4 tera sesaat dan boleh menyokong GPT ringan yang paling canggih yang besar.

See all articles