雲算力之外,一場始於AI的秘密戰爭

王林
發布: 2023-05-30 18:10:14
轉載
1312 人瀏覽過

雲算力之外,一場始於AI的秘密戰爭

今年3月,面對洶湧而來的AI潮,「矽谷刀王」一改往日本色,主動站到台前,宣布推出DGX雲,把AI專用的GPU放到雲上「出租」 。

以往,出售算力這種事都是雲端運算公司在幹。它們購買多種型號顯示卡與人工智慧加速器,根據硬體性能或使用時長等方式定價,然後租給下游客戶。

這個過程中,英偉達將GPU要麼賣給雲端運算平台,要麼直接出售給AI公司,例如第一台NVIDIA DGX超級電腦就是2016年老黃親自交付給OpenAI的,並沒有直接出售算力,頂多算「賣鏟人」。

而DGX上雲這個事,雖然英偉達仍需要將其託管到雲端平台,但本質上已經是跨越邊界了。

一向屈居幕後的英偉達,這次為何要走向台前?

本輪AI潮英偉達毫無疑問是最大的受益者,甚至可以沒有之一。

用於訓練AI的GPU晶片價格瘋長,海外A100和H100的每片價格分別漲到了1.5萬美元和4萬美元,國內一台配置8顆A100和80G儲存空間的AI伺服器,價格也從去年中旬的8萬/台飆升至目前的165萬/台。

但這些錢並沒有都流入英偉達的口袋,溢價都被渠道拿走了,關鍵是這種倒買倒賣英偉達還一點辦法沒有。

DGX雲就在這種情況下應運而生,關鍵價格看似還很便宜。配備8個H100 GPU模組的DGX雲,每月套餐費只要3.7萬美元,相當於單片H100的價格。

雲算力之外,一場始於AI的秘密戰爭

對於急需算力資金又捉襟見肘的AI公司來說,DGX雲無疑是渴睡時天降的一個枕頭;對英偉達而言,出售雲算力既能賺錢又綁定了客戶。

而看似雙贏的背後,卻隱藏著一場始於AI的秘密戰爭。

算力平權

#從產業特徵來看,今天基於雲端算力的AIGC和曾經的加密資產挖礦極為相似,但所需的資源遠高於後者。

國盛證券曾在《Web3 視角下的AIGC算力進化論》中,比較了加密資產挖礦和AIGC產業的異同點:

1 AIGC產業耗電量大約會在1.6-7.5年間超過當前比特幣挖礦產業耗電量,主要驅動因素是GPT類大語言模型在模型參數、日活和模型數量上的高速增長;

2 和比特幣挖礦類似,AIGC產業由算力驅動的內容處於高強度競爭中,參與者只有持續、快速生產出高品質內容,才能保證自己獲取到的用戶注意力不會下降。

這就導致AIGC產業的兩大特徵:高成本和持續性。

其中,成本側不只耗電量,當然耗電量可以作為一個非常直覺的證據。例如百度用於訓練推理文心一言的陽泉超算中心,每小時耗電64000kW·h(度),以0.45元/kW·h的商業用電標準,一年電費就達到2.5億。

而更大的成本則是來自算力投入。

以ChatGPT為例,不考慮與日活高度相關推理過程所需的算力,只考慮訓練過程,根據測算,1750億參數的GPT-3訓練一次大約需要6000張英偉達A100顯卡,如果考慮互聯損失,大約需要上萬張A100。

雲算力之外,一場始於AI的秘密戰爭

以單張A100晶片10萬計算,大規模訓練就需要投入約10億,一般廠商根本承擔不起。而GPT-4的模型參數較大,訓練的識別符較多,所需算力較為可觀。

並且,隨著更多AIGC大模型的發布,其所需算力直線狂飆。

根據OpenAI測算,自2012年至2018年,用於訓練AI所需的算力大約每隔3-4個月翻倍,總共增長了30萬倍(而摩爾定律在相同時間只有7倍的成長), 每年頭部訓練模型所需算力成長幅度高達10倍,整體呈現指數級上升。

雲算力之外,一場始於AI的秘密戰爭

這個時候就體現出雲端算力的優勢了,總結下來可以歸結為8個字:化整為零,按需付費。

雲算力能讓AIGC大模型廠商無需購買英偉達A100顯卡等硬件,而直接按需租用雲算力平台提供的算力,這使得初創企業或非頭部模型廠商也能嘗試進入AIGC領域。

甚至這種「化整為零」的方式,對產業鏈各方都有好處:

1)對上游算力生產商而言,在算力硬體進入淡季、庫存趨增時,能透過販賣雲算力的方式,平滑收入的波動,並為旺季儲備「有生」力量,及時滿足回彈的市場需求;

2)對中游雲服務廠商而言,則有助於增加客流;

3) 對下游算力需求方而言,能最大化降低使用算力的門檻,驅動全民AIGC 時代降臨。

如果AIGC大模型廠商願意讓渡更多資源,還可以更深入地與雲端平台合作。這方面的典型案例是微軟雲端與OpenAI的合作,兩者的合作並沒有停留在算力租用上,而深入了股權與產品的整合。

另外,在大模型競賽中,除了顯性的硬體投入成本,還有一個隱形的時間成本。

一般而言,大模型對於算力的需求分為兩個階段,一是訓練出類ChatGPT大模型的過程;二是將這個模型商業化的推理過程。

而且這個過程越持續大模型就越好。所以現在再來看英偉達DGX雲,就不難搞懂老黃做了一件什麼事。

用雲端的方式把用於AI訓練的GPU價格打下來,算力平權籠絡中小公司,再基於大模型訓練的持續性因素綁定客戶,「矽谷刀王」一舉兩得。

受益的未必是英偉達

從去年12月開始,英偉達A100的價格5個月累計漲幅達到37.5%,同期A800價格累計漲幅也達到了20.0%。

GPU價格暴漲無疑增加了AIGC訓練大模型的門檻,但對於頭部廠商而言,漲多少價GPU都是要買的。但對腰部公司來說,不漲價可能咬咬牙還能下單,一漲價就只能望GPU興嘆了,王慧文創業拿到的5000萬美金融資,可能連訓練所需的顯卡都買不全。

所以,老黃在這個時候拿出DGX雲,就像開了一家豪車租賃公司,讓買不起的人也能租用。

當然,這背後英偉達的另一層考量,即搶在競爭對手前面,綁定更多的中小客戶。

本輪AI熱潮中除OpenAI外,最出圈的AI公司非Midjourney和Authropic莫屬了。前者是AI繪圖應用,最近與QQ頻道合作開啟了國內業務,後者的創辦人則是出自OpenAI,其對話機器人Claude直接對標ChatGPT。

這兩家公司有一個相同點,就是都沒有購買英偉達GPU搭建超算,而是使用Google的算力服務。

雲算力之外,一場始於AI的秘密戰爭

此服務由一個整合4096塊TPU v4的超算系統提供,重點在於Google自研。

另外一家搞自研晶片的巨頭是本輪AI浪潮的領導者微軟,傳聞這款名叫Athena的晶片採用5nm先進製程,由台積電代工,研發團隊人數已經接近300人。

很明顯,這款晶片目標就是取代昂貴的A100/H100,給OpenAI提供算力引擎,並最終一定會透過微軟的Azure雲端服務來搶奪英偉達的蛋糕。

除了雲端運算公司的背刺,英偉達的大客戶特斯拉也要自己單幹。

2021年8月,馬斯克就向外界展示了用3000塊自家D1晶片搭建的超算Dojo ExaPOD。其中D1晶片由台積電代工,採用7nm工藝,3000塊D1晶片直接讓Dojo成為全球第五大算力規模的計算機。

相較之下,受禁令影響的國內公司雖也有替代計劃,但短期內仍嚴重依賴英偉達。

國產晶片可以做對資訊顆粒度要求沒有那麼高的雲端推理工作,但大多目前無法處理超高算力需求的雲端訓練。

燧原科技、壁仞科技、天數智芯、寒武紀等公司都推出了自己的雲端產品,且理論性能指標不弱。

据此前曝光的信息,百度用于训练推理文心一言的阳泉超算中心,除了A100还用了一些国产化的产品,比如百度自研的昆仑芯和寒武纪的思元590,其中有消息显示2023年采购计划思元大概占10%-20%。

雲算力之外,一場始於AI的秘密戰爭

其中,文心一言的芯片层核心能力来自昆仑芯2代AI芯片,其采用自研XPU-R架构、7nm工艺和GDDR6高速显存,通用性和性能显著提升;具有256 TOPS@INT8和128 TFLOPS@FP16的算力水平,较一代提升2-3倍。

今年3月,李彦宏也在亚布力中国企业家论坛上分享,昆仑芯片现在很适合做大模型的推理,将来会适合做训练。

尾声

从RIVA128开始,英伟达就展示了自己惊人的市场观察能力。过去的十几年里,从加密货币挖矿到元宇宙,再到AI潮,英伟达顺势将显卡的客户从游戏玩家拓展到了科技巨头。

伴随着战火蔓延,英伟达市值也一路高歌,从一个二线芯片公司变成了全行业的No.1。只是,黄仁勋说AI的iPhone时刻已到来,那么诺基亚都被苹果打败,英伟达又怎能是无敌的呢。

参考资料

[1] AIGC的看多期权:AI云算力,国盛证券

[2] Web3 视角下的AIGC 算力进化论,国盛证券

[3] 英伟达帝国的一道裂缝,远川研究所

[4] 云算力挖矿可能是现在入场比特币最稳的路,Odaily星球日报

[5] 百度“文心一言”专家解读,独角兽智库

[6] 大模型时代,国产GPU加速「狂飙」,数字时氪

[7] 英伟达黄仁勋:将通过中国云服务商提供AI超算能力,AI的iPhone时刻到来! 第一财经

[8] AI算力产业链梳理:技术迭代推动瓶颈突破,AIgc场景增多驱动算力需求提升,安信证券

以上是雲算力之外,一場始於AI的秘密戰爭的詳細內容。更多資訊請關注PHP中文網其他相關文章!

來源:sohu.com
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板