Rumah > Peranti teknologi > AI > Di luar kuasa pengkomputeran awan, perang rahsia bermula dengan AI

Di luar kuasa pengkomputeran awan, perang rahsia bermula dengan AI

王林
Lepaskan: 2023-05-30 18:10:14
ke hadapan
1375 orang telah melayarinya

Di luar kuasa pengkomputeran awan, perang rahsia bermula dengan AI

Pada bulan Mac tahun ini, dalam menghadapi trend AI yang melonjak, "Raja Pisau Silicon Valley" mengubah sikap Jepunnya dan mengambil inisiatif untuk berdiri di atas pentas dan mengumumkan pelancaran DGX Cloud, meletakkan AI-specific GPU pada awan untuk "menyewa" .

Pada masa lalu, syarikat pengkomputeran awan bertanggungjawab untuk menjual kuasa pengkomputeran. Mereka membeli berbilang model kad grafik dan pemecut kecerdasan buatan, menetapkan harga berdasarkan prestasi perkakasan atau masa penggunaan, dan kemudian menyewakannya kepada pelanggan hiliran.

Dalam proses ini, NVIDIA sama ada menjual GPU kepada platform pengkomputeran awan atau terus kepada syarikat AI Contohnya, superkomputer NVIDIA DGX yang pertama dihantar secara peribadi oleh Huang pada tahun 2016 dan kuasa pengkomputeran tidak dijual secara langsung , dia boleh dianggap sebagai "penjual penyodok".

Mengenai penghijrahan DGX ke awan, walaupun NVIDIA masih perlu mengehoskannya pada platform awan, ia pada dasarnya telah melepasi sempadan.

Kenapa NVIDIA yang sentiasa berada di belakang tabir melangkah ke hadapan pentas kali ini?

Nvidia sudah pasti penerima terbesar pusingan ledakan AI ini, malah mungkin tiada.

Harga cip GPU yang digunakan untuk melatih AI telah melambung tinggi Harga di luar negara iaitu A100 dan H100 setiap cip telah meningkat masing-masing kepada AS$15,000 dan AS$40,000 Harga pelayan AI domestik yang dilengkapi dengan 8 ruang storan A100 dan 80G juga meningkat daripada 80,000/unit pada pertengahan tahun lalu, ia telah melonjak kepada 1.65 juta/unit sekarang.

Tetapi tidak semua wang telah mengalir ke dalam poket Nvidia, dan premium telah diambil oleh saluran Perkara utama ialah tiada cara untuk membeli dan menjual Nvidia.

DGX Cloud wujud dalam situasi ini, dan harga utama nampaknya sangat murah. Awan DGX yang dilengkapi dengan 8 modul GPU H100 mempunyai bayaran pakej bulanan hanya AS$37,000, yang bersamaan dengan harga satu H100.

Di luar kuasa pengkomputeran awan, perang rahsia bermula dengan AI

Bagi syarikat AI yang memerlukan kuasa dan dana pengkomputeran yang mendesak tetapi terbentang nipis, DGX Cloud sudah pasti bantal yang jatuh dari langit apabila mereka mengantuk untuk NVIDIA, menjual kuasa pengkomputeran awan boleh menghasilkan wang dan mengikat pelanggan.

Di sebalik situasi yang kelihatan menang-menang, terdapat perang rahsia yang bermula dengan AI.

Kesamaan kuasa pengkomputeran

Dari perspektif ciri industri, AIGC hari ini berdasarkan kuasa pengkomputeran awan sangat serupa dengan perlombongan aset kripto pada masa lalu, tetapi sumber yang diperlukan jauh lebih tinggi daripada yang terakhir.

Guosheng Securities pernah membandingkan persamaan dan perbezaan antara perlombongan aset kripto dan industri AIGC dalam "Evolusi Kuasa Pengkomputeran AIGC dari Perspektif Web3":

1 Penggunaan kuasa industri AIGC akan melebihi penggunaan kuasa semasa industri perlombongan Bitcoin dalam kira-kira 1.6-7.5 tahun Faktor pendorong utama ialah pertumbuhan pesat model bahasa besar GPT dalam parameter model, aktiviti harian dan nombor daripada model;

2 Sama seperti perlombongan Bitcoin, kandungan yang didorong oleh kuasa pengkomputeran dalam industri AIGC berada dalam persaingan berintensiti tinggi Hanya dengan menghasilkan kandungan berkualiti tinggi secara berterusan dan pantas, peserta dapat memastikan perhatian pengguna yang mereka perolehi tidak akan merosot.

Ini membawa kepada dua ciri utama industri AIGC: kos tinggi dan kemampanan.

Antaranya, bahagian kos bukan sahaja penggunaan kuasa, tetapi sudah tentu penggunaan kuasa boleh digunakan sebagai bukti yang sangat intuitif. Sebagai contoh, pusat pengkomputeran super Yangquan yang digunakan oleh Baidu untuk melatih penaakulan inferens Wen Xinyiyan menggunakan 64,000kW·h (darjah) sejam Menurut standard penggunaan elektrik komersial sebanyak 0.45 yuan/kW·h, bil elektrik tahunan mencecah 250 juta.

Kos yang lebih besar datang daripada pelaburan dalam kuasa pengkomputeran.

Mengambil ChatGPT sebagai contoh, kami tidak menganggap kuasa pengkomputeran yang diperlukan untuk proses inferens yang sangat berkaitan dengan aktiviti harian, tetapi hanya mempertimbangkan proses latihan Menurut pengiraan, satu latihan GPT-3 dengan 175 bilion parameter memerlukan kira-kira 6,000 kad grafik NVIDIA A100 Jika Internet dianggap Rugi, kira-kira puluhan ribu A100 diperlukan.

Di luar kuasa pengkomputeran awan, perang rahsia bermula dengan AI

Berdasarkan RMB 100,000 untuk satu cip A100, latihan berskala besar memerlukan pelaburan kira-kira RMB 1 bilion, yang mana pengeluar biasa tidak mampu membelinya. Parameter model GPT-4 adalah lebih besar, terdapat lebih banyak pengecam untuk latihan, dan kuasa pengkomputeran yang diperlukan adalah lebih besar.

Dan, dengan keluaran model AIGC yang lebih besar, kuasa pengkomputeran yang diperlukan telah melonjak.

Menurut pengiraan OpenAI, dari 2012 hingga 2018, kuasa pengkomputeran yang diperlukan untuk melatih AI meningkat dua kali ganda kira-kira setiap 3-4 bulan, dengan jumlah peningkatan sebanyak 300,000 kali (manakala Undang-undang Moore hanya 7 kali ganda semasa pertumbuhan masa yang sama), kuasa pengkomputeran yang diperlukan untuk model latihan kepala meningkat sebanyak 10 kali setiap tahun, dan peningkatan keseluruhan adalah eksponen.

Di luar kuasa pengkomputeran awan, perang rahsia bermula dengan AI

Pada masa ini, kelebihan kuasa pengkomputeran awan dapat disimpulkan dalam 8 perkataan: pecahkannya kepada bahagian dan bayar atas permintaan.

Kuasa pengkomputeran awan membolehkan pengeluar model AIGC yang besar menyewa perkakasan yang disediakan oleh platform pengkomputeran awan secara terus atas permintaan tanpa membeli perkakasan seperti kad grafik NVIDIA A100 Ini membolehkan syarikat pemula atau pengeluar model bukan ketua untuk turut mencuba medan AIGC.

Malah pendekatan "pecahkannya" ini memberi manfaat kepada semua pihak dalam rantaian industri:

1) Bagi pengeluar kuasa pengkomputeran huluan, apabila perkakasan pengkomputeran memasuki musim luar dan inventori meningkat, mereka boleh melancarkan turun naik dalam pendapatan dengan menjual kuasa pengkomputeran awan dan menyimpan kuasa "hidup" untuk musim puncak permintaan tepat pada masanya;

2) Bagi penyedia perkhidmatan awan pertengahan, ia akan membantu meningkatkan aliran pelanggan;

3) Bagi peminta kuasa pengkomputeran hiliran, ia boleh meminimumkan ambang untuk menggunakan kuasa pengkomputeran dan memacu kemunculan era AIGC untuk semua.

Jika pengeluar model besar AIGC bersedia untuk memindahkan lebih banyak sumber, mereka juga boleh bekerjasama dengan lebih mendalam dengan platform awan. Kes biasa dalam hal ini ialah kerjasama antara Microsoft Cloud dan OpenAI Kerjasama antara kedua-duanya tidak berhenti pada menyewa kuasa pengkomputeran, tetapi pergi jauh ke dalam integrasi ekuiti dan produk.

Selain itu, dalam pertandingan model besar, sebagai tambahan kepada kos pelaburan perkakasan yang jelas, terdapat juga kos masa yang tidak kelihatan.

Secara amnya, keperluan kuasa pengkomputeran model besar dibahagikan kepada dua peringkat yang pertama ialah proses melatih model besar yang serupa dengan ChatGPT; yang kedua ialah proses inferens untuk mengkomersialkan model ini.

Dan semakin lama proses ini berterusan, lebih baik untuk model yang lebih besar. Jadi sekarang jika kita melihat NVIDIA DGX Cloud, tidak sukar untuk memahami apa yang dilakukan oleh Lao Huang.

Menggunakan kaedah awan untuk menurunkan harga GPU yang digunakan untuk latihan AI, memenangi syarikat kecil dan sederhana dengan akses yang sama kepada kuasa pengkomputeran, dan kemudian mengikat pelanggan berdasarkan faktor kemampanan latihan model besar, " King of Silicon Valley" membunuh dua burung dengan satu batu.

Mungkin bukan Nvidia yang mendapat manfaat

Sejak Disember tahun lepas, harga Nvidia A100 telah meningkat sebanyak 37.5% dalam tempoh lima bulan, dan harga A800 telah meningkat sebanyak 20.0% dalam tempoh yang sama.

Harga GPU yang melambung tinggi sudah pasti telah meningkatkan ambang AIGC untuk melatih model besar, tetapi bagi pengeluar terkemuka, mereka perlu membeli GPU tanpa mengira kenaikan harga. Tetapi bagi syarikat pinggang, mereka mungkin boleh mengetap gigi dan membuat pesanan jika harganya tidak meningkat, mereka hanya boleh bergantung pada GPU AS$50 juta yang diterima Wang Huiwen untuk memulakan perniagaannya malah boleh membeli semua kad grafik yang diperlukan untuk latihan.

Jadi, apabila Lao Huang mengeluarkan DGX Cloud pada masa ini, ia seperti membuka syarikat sewa kereta mewah, sehingga orang yang tidak mampu juga boleh menyewanya.

Sudah tentu, pertimbangan lain di sebalik ini adalah untuk mendahului pesaing dan mengikat lebih ramai pelanggan kecil dan sederhana.

Selain OpenAI, syarikat AI yang paling luar kalangan dalam pusingan kegilaan AI ini tidak lain adalah Midjourney dan Authropic. Yang pertama adalah aplikasi lukisan AI yang baru-baru ini melancarkan perniagaan domestik dengan kerjasama saluran QQ Pengasas yang kedua berasal dari OpenAI, dan robot perbualannya Claude secara langsung menanda aras ChatGPT.

Kedua-dua syarikat mempunyai satu persamaan, iaitu, mereka tidak membeli GPU Nvidia untuk membina superkomputer, sebaliknya menggunakan perkhidmatan pengkomputeran Google.

Di luar kuasa pengkomputeran awan, perang rahsia bermula dengan AIPerkhidmatan ini disediakan oleh sistem superkomputer yang menyepadukan 4096 TPU v4, memfokuskan pada penyelidikan Google sendiri.

Satu lagi syarikat gergasi yang terlibat dalam cip yang dibangunkan sendiri ialah Microsoft, peneraju gelombang AI ini Dikhabarkan bahawa cip yang dipanggil Athena ini menggunakan proses 5nm termaju dan dihasilkan oleh TSMC Jumlah pasukan R&D adalah hampir 300 orang ramai.

Jelas sekali, matlamat cip ini adalah untuk menggantikan A100/H100 yang mahal, menyediakan enjin kuasa pengkomputeran untuk OpenAI, dan akhirnya akan merebut kek Nvidia melalui perkhidmatan awan Azure Microsoft.

Selain tikam belakang daripada syarikat pengkomputeran awan, pelanggan utama Nvidia, Tesla juga mahu melakukannya sendiri.

Pada Ogos 2021, Musk menunjukkan kepada dunia luar Dojo ExaPOD pengkomputeran super yang dibina dengan 3,000 cip D1 miliknya sendiri. Antaranya, cip D1 dikeluarkan oleh TSMC dan menggunakan proses 7nm 3,000 cip D1 secara langsung menjadikan Dojo sebagai komputer kelima terbesar di dunia dari segi kuasa pengkomputeran.

Sebaliknya, walaupun syarikat domestik yang terjejas oleh larangan itu juga mempunyai rancangan alternatif, mereka masih banyak bergantung pada Nvidia dalam jangka pendek.

Cip domestik boleh melakukan kerja inferens awan yang tidak memerlukan kebutiran maklumat yang begitu tinggi, tetapi kebanyakannya pada masa ini tidak dapat mengendalikan latihan awan yang memerlukan kuasa pengkomputeran ultra tinggi.

Syarikat seperti Suiyuan Technology, Biren Technology, Tianshu Zhixin dan Cambrian semuanya telah melancarkan produk awan mereka sendiri, dan penunjuk prestasi teori tidak lemah.

Menurut maklumat yang terdedah sebelum ini, pusat pengkomputeran super Yangquan yang digunakan oleh Baidu untuk melatih inferens Wen Xinyiyan, sebagai tambahan kepada A100, juga menggunakan beberapa produk keluaran dalam negara, seperti teras Kunlun yang dibangunkan sendiri oleh Baidu dan Siyuan 590 Cambrian. Antaranya , terdapat berita bahawa Siyuan menyumbang kira-kira 10%-20% daripada rancangan perolehan 2023.

Di luar kuasa pengkomputeran awan, perang rahsia bermula dengan AI

Antaranya, keupayaan teras lapisan cip Wen Xinyiyan berasal daripada cip AI generasi ke-2 Kunlun Core, yang menggunakan seni bina XPU-R yang dibangunkan sendiri, proses 7nm dan memori video berkelajuan tinggi GDDR6, meningkatkan fleksibiliti dan prestasi dengan ketara; TOPS@ Tahap kuasa pengkomputeran INT8 dan 128 TFLOPS@FP16 adalah 2-3 kali lebih tinggi daripada generasi sebelumnya.

Pada bulan Mac tahun ini, Robin Li turut berkongsi di Forum Usahawan Yabuli China bahawa kerepek Kunlun kini sangat sesuai untuk inferens model besar dan sesuai untuk latihan pada masa hadapan.

Epilog

Sejak RIVA128, NVIDIA telah menunjukkan keupayaan pemerhatian pasarannya yang menakjubkan. Sepanjang dekad yang lalu atau lebih, daripada perlombongan mata wang kripto kepada Metaverse kepada ledakan AI, Nvidia telah mengambil kesempatan daripada trend untuk mengembangkan pelanggan kad grafiknya daripada pemain kepada gergasi teknologi.

Ketika perang merebak, nilai pasaran Nvidia juga melonjak, daripada syarikat cip peringkat kedua kepada No. 1 dalam industri. Walau bagaimanapun, Huang Renxun berkata bahawa detik AI iPhone telah tiba, jadi bagaimana Nvidia tidak dapat dikalahkan walaupun Nokia dikalahkan oleh Apple.

Bahan rujukan

[1] Pilihan panjang AIGC: kuasa pengkomputeran awan AI, Guosheng Securities

[2] Teori evolusi kuasa pengkomputeran AIGC dari perspektif Web3, Guosheng Securities

[3] Retak dalam empayar NVIDIA, Institut Penyelidikan Yuanchuan

[4] Perlombongan kuasa pengkomputeran awan mungkin merupakan cara paling stabil untuk memasuki Bitcoin sekarang, Odaily Planet Daily

[5] Tafsiran pakar "Wen Xin Yi Yan" Baidu, Badan Pemikir Unicorn

[6] Dalam era model besar, GPU domestik semakin mempercepatkan "liar", dan masa digital ialah kripton

[7] NVIDIA Jensen Huang: Keupayaan pengkomputeran super AI akan disediakan melalui pembekal perkhidmatan awan China, dan AI iPhone akan datang! Berita Perniagaan China

[8] Gambaran keseluruhan rantai industri kuasa pengkomputeran AI: Lelaran teknologi menggalakkan penembusan kesesakan, dan peningkatan dalam senario AIgc mendorong permintaan untuk kuasa pengkomputeran, Essence Securities

Atas ialah kandungan terperinci Di luar kuasa pengkomputeran awan, perang rahsia bermula dengan AI. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

sumber:sohu.com
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan