


Ralat pembangunan kecerdasan buatan meta, kegagalan untuk menggunakan GPU dalam masa mengakibatkan ketinggalan di belakang lawan
Memo dalaman menunjukkan bahawa pada akhir musim panas 2022, Ketua Pegawai Eksekutif Meta Mark Zuckerberg telah memanggil sekumpulan eksekutif syarikat untuk menganalisis kuasa pengkomputeran syarikat selama lima tahun, terutamanya keupayaan untuk mengendalikan pemotongan -kepintaran buatan tepi.
Memo itu menunjukkan bahawa walaupun pelaburan berprofil tinggi Meta dalam penyelidikan kecerdasan buatan dan pergantungan syarikat yang semakin meningkat pada kecerdasan buatan untuk menyokong pertumbuhannya, penggunaan perisian dan sistem perkakasan yang dioptimumkan kecerdasan buatan yang mahal dalam perniagaan utamanya mempunyai Rentak perlahan gergasi media sosial itu telah menghalang keupayaannya untuk bersaing dengan inovasi semasa ia berkembang. Meta perlu "menukar secara asasnya reka bentuk infrastruktur fizikal kami, sistem perisian dan pendekatan untuk menyampaikan platform yang stabil" jika ia mahu menyokong usaha AInya.
Perubahan itu meningkatkan perbelanjaan modal Meta sebanyak kira-kira $4 bilion setiap suku tahun, hampir dua kali ganda pada 2021, dan menyebabkannya menjeda atau membatalkan rancangan untuk membina pusat data di empat lokasi, dedah syarikat itu.
Meta menghadapi masalah kewangan yang teruk Sejak November tahun lalu, syarikat itu telah melakukan pemberhentian yang tidak pernah berlaku sebelum ini.
Pada masa yang sama, kemunculan ChatGPT pada November tahun lalu mencetuskan persaingan dalam kalangan gergasi teknologi, yang telah mengeluarkan produk AI generatif. Lima sumber berkata bahawa AI generatif memerlukan banyak kuasa pengkomputeran, yang memperhebatkan mendesak pengembangan Meta.
Sumber mendedahkan bahawa penggunaan GPU Meta yang perlahan dalam kecerdasan buatan adalah salah satu masalah utama. Cip GPU sesuai untuk pemprosesan AI kerana ia boleh melaksanakan sejumlah besar tugas serentak, memendekkan masa yang diperlukan untuk memproses berbilion-bilion keping data. Walau bagaimanapun, cip GPU lebih mahal, dan pembuat cip Nvidia mengawal 80% pasaran dan mengekalkan peneraju dalam perisian yang sepadan, kata sumber.
Sehingga tahun lepas, Meta menggunakan sejumlah besar CPU biasa untuk menjalankan beban kerja AI. CPU adalah cip kuda kerja dalam dunia komputer Walaupun ia telah menguasai pusat data selama beberapa dekad, ia tidak berfungsi dengan baik dalam kerja kecerdasan buatan.
Ini telah menyebabkan pesaing mengatasi Meta dalam bidang AI. Mereka menggunakan cip GPU dan mempunyai perisian AI yang lebih baik, supaya mereka boleh membangunkan produk dan perkhidmatan AI baharu dengan lebih pantas.
Menurut dua sumber, Meta juga telah mula menggunakan cip tersuainya sendiri yang direka secara dalaman untuk melatih AI. Tetapi pada tahun 2021, pendekatan serampang dua mata ini terbukti lebih perlahan dan kurang cekap daripada pendekatan yang dibina dengan GPU pada terasnya. Cip GPU juga lebih fleksibel daripada cip Meta dalam menjalankan pelbagai jenis model, kata kedua-dua sumber itu.
Kemudian, apabila Zuckerberg menggerakkan syarikat itu ke dalam Metaverse, kekurangan kuasa pengkomputeran menyebabkan syarikat itu tidak dapat bertindak balas terhadap ancaman, termasuk peningkatan perubahan privasi iklan yang diterajui oleh TikTok dan Apple.
Isu ini telah menarik perhatian bekas ahli lembaga Meta Peter Thiel. Pada awal 2022, beliau meletakkan jawatan tanpa menjelaskan sebabnya. Menurut dua orang yang biasa dengan perkara itu, semasa mesyuarat lembaga sebelum pemergiannya, Thiel menegaskan bahawa Zuckerberg dan eksekutifnya terlalu fokus pada pembangunan Metaverse dan mengabaikan perniagaan media sosial teras Meta Meninggalkan syarikat terdedah kepada cabaran daripada pesaing seperti TikTok.
Meta telah merancang untuk melancarkan cip tersuai pada tahun 2022, tetapi kemudiannya menyerah dan sebaliknya memesan berbilion dolar dalam cip GPU Nvidia pada tahun yang sama. Pada ketika ini Meta telah ketinggalan di belakang rakan sebaya seperti Google, yang pada tahun 2015 mula menggunakan versi GPU tersuainya sendiri, yang dipanggil TPU.
Meta kemudian mula menyusun semula jabatan kecerdasan buatan dan melantik dua jurutera baharu untuk mengetuainya. Pada masa itu, berpuluh-puluh eksekutif telah meninggalkan Meta, hampir kesemuanya menggantikan kepimpinan infrastruktur AInya.
Seterusnya, Meta mula merombak pusat datanya untuk menampung pengenalan GPU ini memerlukan lebih banyak kuasa dan menjana lebih banyak haba, dan mesti dikelompokkan secara rapat dan di antara mereka. Kerja ini memerlukan kapasiti rangkaian yang ketara dan sistem penyejukan cecair baharu untuk menguruskan haba kluster, yang memerlukan "reka bentuk semula lengkap" daripadanya.
Semasa kerja berjalan, Meta memulakan rancangan dalaman untuk membangunkan cip baharu yang lebih bercita-cita tinggi, serupa dengan GPU, yang boleh melatih model kecerdasan buatan dan melakukan inferens. Dua sumber berkata projek itu akan siap sekitar 2025.
Jurucakap meta Jon Carvill enggan mengulas mengenai projek cip itu.
Walaupun Meta meningkatkan GPU, syarikat seperti Microsoft dan Google mempromosikan produk AI generatif komersial, dan Meta tidak membuat banyak kemajuan yang ketara dalam hal ini.
CFO Meta mengakui pada bulan Februari bahawa syarikat itu pada masa ini tidak menumpukan sebahagian besar kuasa pengkomputerannya untuk kerja generatif. "Pada asasnya semua keupayaan kecerdasan buatan kami digunakan dalam pengiklanan, suapan berita dan Reels," katanya Reels ialah format video pendek seperti TikTok Meta yang popular dengan pengguna muda.
Menurut empat sumber, Meta tidak mengutamakan pembangunan produk AI generatif sehingga ChatGPT dilancarkan pada November tahun lalu. Walaupun cabang penyelidikan AI syarikat telah mengeluarkan prototaip teknologi sejak lewat 2021, ia tidak memfokuskan untuk mengubahnya menjadi produk. Walau bagaimanapun, apabila minat pelabur terus meningkat, Zuckerberg pada Februari mengumumkan penciptaan pasukan AI generatif peringkat tinggi baharu yang katanya akan "mempercepatkan" kerja syarikat dalam bidang ini.
Ketua Pegawai Teknologi Andrew Bosworth juga berkata bulan ini bahawa kecerdasan buatan generatif ialah kawasan di mana dia dan Zuckerberg menghabiskan paling banyak masa, dan meramalkan bahawa Meta akan melancarkan produk baharu tahun ini.
Dua orang yang biasa dengan pasukan baharu berkata kerja pasukan itu di peringkat awal dan tertumpu pada membina model asas, program teras yang kemudiannya boleh diperhalusi dan disesuaikan dengan produk yang berbeza.
Jurucakap Meta Carvill berkata bahawa syarikat itu telah membangunkan produk kecerdasan buatan generatif pada pasukan berbeza selama lebih daripada setahun. Beliau mengesahkan bahawa kerja ini telah dipercepatkan dalam beberapa bulan sejak ChatGPT dilancarkan.
Atas ialah kandungan terperinci Ralat pembangunan kecerdasan buatan meta, kegagalan untuk menggunakan GPU dalam masa mengakibatkan ketinggalan di belakang lawan. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

Video Face Swap
Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas

Laman web ini melaporkan pada 27 Jun bahawa Jianying ialah perisian penyuntingan video yang dibangunkan oleh FaceMeng Technology, anak syarikat ByteDance Ia bergantung pada platform Douyin dan pada asasnya menghasilkan kandungan video pendek untuk pengguna platform tersebut Windows , MacOS dan sistem pengendalian lain. Jianying secara rasmi mengumumkan peningkatan sistem keahliannya dan melancarkan SVIP baharu, yang merangkumi pelbagai teknologi hitam AI, seperti terjemahan pintar, penonjolan pintar, pembungkusan pintar, sintesis manusia digital, dsb. Dari segi harga, yuran bulanan untuk keratan SVIP ialah 79 yuan, yuran tahunan ialah 599 yuan (nota di laman web ini: bersamaan dengan 49.9 yuan sebulan), langganan bulanan berterusan ialah 59 yuan sebulan, dan langganan tahunan berterusan ialah 499 yuan setahun (bersamaan dengan 41.6 yuan sebulan) . Di samping itu, pegawai yang dipotong juga menyatakan bahawa untuk meningkatkan pengalaman pengguna, mereka yang telah melanggan VIP asal

Tingkatkan produktiviti, kecekapan dan ketepatan pembangun dengan menggabungkan penjanaan dipertingkatkan semula dan memori semantik ke dalam pembantu pengekodan AI. Diterjemah daripada EnhancingAICodingAssistantswithContextUsingRAGandSEM-RAG, pengarang JanakiramMSV. Walaupun pembantu pengaturcaraan AI asas secara semulajadi membantu, mereka sering gagal memberikan cadangan kod yang paling relevan dan betul kerana mereka bergantung pada pemahaman umum bahasa perisian dan corak penulisan perisian yang paling biasa. Kod yang dijana oleh pembantu pengekodan ini sesuai untuk menyelesaikan masalah yang mereka bertanggungjawab untuk menyelesaikannya, tetapi selalunya tidak mematuhi piawaian pengekodan, konvensyen dan gaya pasukan individu. Ini selalunya menghasilkan cadangan yang perlu diubah suai atau diperhalusi agar kod itu diterima ke dalam aplikasi

Model Bahasa Besar (LLM) dilatih pada pangkalan data teks yang besar, di mana mereka memperoleh sejumlah besar pengetahuan dunia sebenar. Pengetahuan ini dibenamkan ke dalam parameter mereka dan kemudiannya boleh digunakan apabila diperlukan. Pengetahuan tentang model ini "diperbaharui" pada akhir latihan. Pada akhir pra-latihan, model sebenarnya berhenti belajar. Selaraskan atau perhalusi model untuk mempelajari cara memanfaatkan pengetahuan ini dan bertindak balas dengan lebih semula jadi kepada soalan pengguna. Tetapi kadangkala pengetahuan model tidak mencukupi, dan walaupun model boleh mengakses kandungan luaran melalui RAG, ia dianggap berfaedah untuk menyesuaikan model kepada domain baharu melalui penalaan halus. Penalaan halus ini dilakukan menggunakan input daripada anotasi manusia atau ciptaan LLM lain, di mana model menemui pengetahuan dunia sebenar tambahan dan menyepadukannya

Acara Meta Connect 2024 ditetapkan pada 25 hingga 26 September, dan dalam acara ini, syarikat itu dijangka memperkenalkan set kepala realiti maya mampu milik baharu. Dikhabarkan sebagai Meta Quest 3S, set kepala VR nampaknya telah muncul pada penyenaraian FCC. cadangan ini

Sediakan GPU anda! Llama3.1 akhirnya muncul, tetapi sumbernya bukan Meta rasmi. Hari ini, berita bocor versi baharu model besar Llama menjadi tular di Reddit Selain model asas, ia juga termasuk hasil penanda aras 8B, 70B dan parameter maksimum 405B. Rajah di bawah menunjukkan hasil perbandingan setiap versi Llama3.1 dengan OpenAIGPT-4o dan Llama38B/70B. Ia boleh dilihat bahawa walaupun versi 70B melebihi GPT-4o pada pelbagai penanda aras. Sumber imej: https://x.com/mattshumer_/status/1815444612414087294 Jelas sekali, versi 3.1 daripada 8B dan 70

Editor |ScienceAI Question Answering (QA) set data memainkan peranan penting dalam mempromosikan penyelidikan pemprosesan bahasa semula jadi (NLP). Set data QA berkualiti tinggi bukan sahaja boleh digunakan untuk memperhalusi model, tetapi juga menilai dengan berkesan keupayaan model bahasa besar (LLM), terutamanya keupayaan untuk memahami dan menaakul tentang pengetahuan saintifik. Walaupun pada masa ini terdapat banyak set data QA saintifik yang meliputi bidang perubatan, kimia, biologi dan bidang lain, set data ini masih mempunyai beberapa kekurangan. Pertama, borang data adalah agak mudah, kebanyakannya adalah soalan aneka pilihan. Ia mudah dinilai, tetapi mengehadkan julat pemilihan jawapan model dan tidak dapat menguji sepenuhnya keupayaan model untuk menjawab soalan saintifik. Sebaliknya, Soal Jawab terbuka

Sebentar tadi, Llama 3.1 yang ditunggu-tunggu telah dikeluarkan secara rasmi! Meta secara rasmi mengeluarkan suara bahawa "sumber terbuka membawa era baru." Dalam blog rasmi, Meta berkata: "Sehingga hari ini, model bahasa besar sumber terbuka kebanyakannya ketinggalan di belakang model tertutup dari segi kefungsian dan prestasi. Kini, kami menyambut era baharu yang diterajui oleh sumber terbuka. Kami mengeluarkan MetaLlama3.1405B secara terbuka. , yang kami percaya Ia adalah model asas sumber terbuka yang terbesar dan paling berkuasa di dunia Sehingga kini, jumlah muat turun semua versi Llama telah melebihi 300 juta kali, dan kami baru sahaja memulakan pengasas dan Ketua Pegawai Eksekutif Meta Zuckerberg artikel panjang "OpenSourceAIIsthePathForward",

Lebih setahun kini telah berlalu daripada keluaran awal Meta untuk Quest 3 (sekira $499.99 di Amazon). Sejak itu, Apple telah menghantar Vision Pro yang jauh lebih mahal, manakala Byte Dance kini telah memperkenalkan Pico 4 Ultra di China. Walau bagaimanapun, terdapat
