首頁 科技週邊 人工智慧 雲算力之外,一場始於AI的秘密戰爭

雲算力之外,一場始於AI的秘密戰爭

May 30, 2023 pm 06:10 PM
雲端運算、人工智慧、秘密戰爭

雲算力之外,一場始於AI的秘密戰爭

今年3月,面對洶湧而來的AI潮,「矽谷刀王」一改往日本色,主動站到台前,宣布推出DGX雲,把AI專用的GPU放到雲上「出租」 。

以往,出售算力這種事都是雲端運算公司在幹。它們購買多種型號顯示卡與人工智慧加速器,根據硬體性能或使用時長等方式定價,然後租給下游客戶。

這個過程中,英偉達將GPU要麼賣給雲端運算平台,要麼直接出售給AI公司,例如第一台NVIDIA DGX超級電腦就是2016年老黃親自交付給OpenAI的,並沒有直接出售算力,頂多算「賣鏟人」。

而DGX上雲這個事,雖然英偉達仍需要將其託管到雲端平台,但本質上已經是跨越邊界了。

一向屈居幕後的英偉達,這次為何要走向台前?

本輪AI潮英偉達毫無疑問是最大的受益者,甚至可以沒有之一。

用於訓練AI的GPU晶片價格瘋長,海外A100和H100的每片價格分別漲到了1.5萬美元和4萬美元,國內一台配置8顆A100和80G儲存空間的AI伺服器,價格也從去年中旬的8萬/台飆升至目前的165萬/台。

但這些錢並沒有都流入英偉達的口袋,溢價都被渠道拿走了,關鍵是這種倒買倒賣英偉達還一點辦法沒有。

DGX雲就在這種情況下應運而生,關鍵價格看似還很便宜。配備8個H100 GPU模組的DGX雲,每月套餐費只要3.7萬美元,相當於單片H100的價格。

雲算力之外,一場始於AI的秘密戰爭

對於急需算力資金又捉襟見肘的AI公司來說,DGX雲無疑是渴睡時天降的一個枕頭;對英偉達而言,出售雲算力既能賺錢又綁定了客戶。

而看似雙贏的背後,卻隱藏著一場始於AI的秘密戰爭。

算力平權

#從產業特徵來看,今天基於雲端算力的AIGC和曾經的加密資產挖礦極為相似,但所需的資源遠高於後者。

國盛證券曾在《Web3 視角下的AIGC算力進化論》中,比較了加密資產挖礦和AIGC產業的異同點:

1 AIGC產業耗電量大約會在1.6-7.5年間超過當前比特幣挖礦產業耗電量,主要驅動因素是GPT類大語言模型在模型參數、日活和模型數量上的高速增長;

2 和比特幣挖礦類似,AIGC產業由算力驅動的內容處於高強度競爭中,參與者只有持續、快速生產出高品質內容,才能保證自己獲取到的用戶注意力不會下降。

這就導致AIGC產業的兩大特徵:高成本和持續性。

其中,成本側不只耗電量,當然耗電量可以作為一個非常直覺的證據。例如百度用於訓練推理文心一言的陽泉超算中心,每小時耗電64000kW·h(度),以0.45元/kW·h的商業用電標準,一年電費就達到2.5億。

而更大的成本則是來自算力投入。

以ChatGPT為例,不考慮與日活高度相關推理過程所需的算力,只考慮訓練過程,根據測算,1750億參數的GPT-3訓練一次大約需要6000張英偉達A100顯卡,如果考慮互聯損失,大約需要上萬張A100。

雲算力之外,一場始於AI的秘密戰爭

以單張A100晶片10萬計算,大規模訓練就需要投入約10億,一般廠商根本承擔不起。而GPT-4的模型參數較大,訓練的識別符較多,所需算力較為可觀。

並且,隨著更多AIGC大模型的發布,其所需算力直線狂飆。

根據OpenAI測算,自2012年至2018年,用於訓練AI所需的算力大約每隔3-4個月翻倍,總共增長了30萬倍(而摩爾定律在相同時間只有7倍的成長), 每年頭部訓練模型所需算力成長幅度高達10倍,整體呈現指數級上升。

雲算力之外,一場始於AI的秘密戰爭

這個時候就體現出雲端算力的優勢了,總結下來可以歸結為8個字:化整為零,按需付費。

雲算力能讓AIGC大模型廠商無需購買英偉達A100顯卡等硬件,而直接按需租用雲算力平台提供的算力,這使得初創企業或非頭部模型廠商也能嘗試進入AIGC領域。

甚至這種「化整為零」的方式,對產業鏈各方都有好處:

1)對上游算力生產商而言,在算力硬體進入淡季、庫存趨增時,能透過販賣雲算力的方式,平滑收入的波動,並為旺季儲備「有生」力量,及時滿足回彈的市場需求;

2)對中游雲服務廠商而言,則有助於增加客流;

3) 對下游算力需求方而言,能最大化降低使用算力的門檻,驅動全民AIGC 時代降臨。

如果AIGC大模型廠商願意讓渡更多資源,還可以更深入地與雲端平台合作。這方面的典型案例是微軟雲端與OpenAI的合作,兩者的合作並沒有停留在算力租用上,而深入了股權與產品的整合。

另外,在大模型競賽中,除了顯性的硬體投入成本,還有一個隱形的時間成本。

一般而言,大模型對於算力的需求分為兩個階段,一是訓練出類ChatGPT大模型的過程;二是將這個模型商業化的推理過程。

而且這個過程越持續大模型就越好。所以現在再來看英偉達DGX雲,就不難搞懂老黃做了一件什麼事。

用雲端的方式把用於AI訓練的GPU價格打下來,算力平權籠絡中小公司,再基於大模型訓練的持續性因素綁定客戶,「矽谷刀王」一舉兩得。

受益的未必是英偉達

從去年12月開始,英偉達A100的價格5個月累計漲幅達到37.5%,同期A800價格累計漲幅也達到了20.0%。

GPU價格暴漲無疑增加了AIGC訓練大模型的門檻,但對於頭部廠商而言,漲多少價GPU都是要買的。但對腰部公司來說,不漲價可能咬咬牙還能下單,一漲價就只能望GPU興嘆了,王慧文創業拿到的5000萬美金融資,可能連訓練所需的顯卡都買不全。

所以,老黃在這個時候拿出DGX雲,就像開了一家豪車租賃公司,讓買不起的人也能租用。

當然,這背後英偉達的另一層考量,即搶在競爭對手前面,綁定更多的中小客戶。

本輪AI熱潮中除OpenAI外,最出圈的AI公司非Midjourney和Authropic莫屬了。前者是AI繪圖應用,最近與QQ頻道合作開啟了國內業務,後者的創辦人則是出自OpenAI,其對話機器人Claude直接對標ChatGPT。

這兩家公司有一個相同點,就是都沒有購買英偉達GPU搭建超算,而是使用Google的算力服務。

雲算力之外,一場始於AI的秘密戰爭

此服務由一個整合4096塊TPU v4的超算系統提供,重點在於Google自研。

另外一家搞自研晶片的巨頭是本輪AI浪潮的領導者微軟,傳聞這款名叫Athena的晶片採用5nm先進製程,由台積電代工,研發團隊人數已經接近300人。

很明顯,這款晶片目標就是取代昂貴的A100/H100,給OpenAI提供算力引擎,並最終一定會透過微軟的Azure雲端服務來搶奪英偉達的蛋糕。

除了雲端運算公司的背刺,英偉達的大客戶特斯拉也要自己單幹。

2021年8月,馬斯克就向外界展示了用3000塊自家D1晶片搭建的超算Dojo ExaPOD。其中D1晶片由台積電代工,採用7nm工藝,3000塊D1晶片直接讓Dojo成為全球第五大算力規模的計算機。

相較之下,受禁令影響的國內公司雖也有替代計劃,但短期內仍嚴重依賴英偉達。

國產晶片可以做對資訊顆粒度要求沒有那麼高的雲端推理工作,但大多目前無法處理超高算力需求的雲端訓練。

燧原科技、壁仞科技、天數智芯、寒武紀等公司都推出了自己的雲端產品,且理論性能指標不弱。

据此前曝光的信息,百度用于训练推理文心一言的阳泉超算中心,除了A100还用了一些国产化的产品,比如百度自研的昆仑芯和寒武纪的思元590,其中有消息显示2023年采购计划思元大概占10%-20%。

雲算力之外,一場始於AI的秘密戰爭

其中,文心一言的芯片层核心能力来自昆仑芯2代AI芯片,其采用自研XPU-R架构、7nm工艺和GDDR6高速显存,通用性和性能显著提升;具有256 TOPS@INT8和128 TFLOPS@FP16的算力水平,较一代提升2-3倍。

今年3月,李彦宏也在亚布力中国企业家论坛上分享,昆仑芯片现在很适合做大模型的推理,将来会适合做训练。

尾声

从RIVA128开始,英伟达就展示了自己惊人的市场观察能力。过去的十几年里,从加密货币挖矿到元宇宙,再到AI潮,英伟达顺势将显卡的客户从游戏玩家拓展到了科技巨头。

伴随着战火蔓延,英伟达市值也一路高歌,从一个二线芯片公司变成了全行业的No.1。只是,黄仁勋说AI的iPhone时刻已到来,那么诺基亚都被苹果打败,英伟达又怎能是无敌的呢。

参考资料

[1] AIGC的看多期权:AI云算力,国盛证券

[2] Web3 视角下的AIGC 算力进化论,国盛证券

[3] 英伟达帝国的一道裂缝,远川研究所

[4] 云算力挖矿可能是现在入场比特币最稳的路,Odaily星球日报

[5] 百度“文心一言”专家解读,独角兽智库

[6] 大模型时代,国产GPU加速「狂飙」,数字时氪

[7] 英伟达黄仁勋:将通过中国云服务商提供AI超算能力,AI的iPhone时刻到来! 第一财经

[8] AI算力产业链梳理:技术迭代推动瓶颈突破,AIgc场景增多驱动算力需求提升,安信证券

以上是雲算力之外,一場始於AI的秘密戰爭的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Java教學
1653
14
CakePHP 教程
1413
52
Laravel 教程
1304
25
PHP教程
1251
29
C# 教程
1224
24
開始使用Meta Llama 3.2 -Analytics Vidhya 開始使用Meta Llama 3.2 -Analytics Vidhya Apr 11, 2025 pm 12:04 PM

Meta的Llama 3.2:多模式和移動AI的飛躍 Meta最近公佈了Llama 3.2,這是AI的重大進步,具有強大的視覺功能和針對移動設備優化的輕量級文本模型。 以成功為基礎

10個生成AI編碼擴展,在VS代碼中,您必須探索 10個生成AI編碼擴展,在VS代碼中,您必須探索 Apr 13, 2025 am 01:14 AM

嘿,編碼忍者!您當天計劃哪些與編碼有關的任務?在您進一步研究此博客之前,我希望您考慮所有與編碼相關的困境,這是將其列出的。 完畢? - 讓&#8217

AV字節:Meta' llama 3.2,Google的雙子座1.5等 AV字節:Meta' llama 3.2,Google的雙子座1.5等 Apr 11, 2025 pm 12:01 PM

本週的AI景觀:進步,道德考慮和監管辯論的旋風。 OpenAI,Google,Meta和Microsoft等主要參與者已經釋放了一系列更新,從開創性的新車型到LE的關鍵轉變

向員工出售AI策略:Shopify首席執行官的宣言 向員工出售AI策略:Shopify首席執行官的宣言 Apr 10, 2025 am 11:19 AM

Shopify首席執行官TobiLütke最近的備忘錄大膽地宣布AI對每位員工的基本期望是公司內部的重大文化轉變。 這不是短暫的趨勢。這是整合到P中的新操作範式

GPT-4O vs OpenAI O1:新的Openai模型值得炒作嗎? GPT-4O vs OpenAI O1:新的Openai模型值得炒作嗎? Apr 13, 2025 am 10:18 AM

介紹 Openai已根據備受期待的“草莓”建築發布了其新模型。這種稱為O1的創新模型增強了推理能力,使其可以通過問題進行思考

視覺語言模型(VLMS)的綜合指南 視覺語言模型(VLMS)的綜合指南 Apr 12, 2025 am 11:58 AM

介紹 想像一下,穿過​​美術館,周圍是生動的繪畫和雕塑。現在,如果您可以向每一部分提出一個問題並獲得有意義的答案,該怎麼辦?您可能會問:“您在講什麼故事?

如何在SQL中添加列? - 分析Vidhya 如何在SQL中添加列? - 分析Vidhya Apr 17, 2025 am 11:43 AM

SQL的Alter表語句:動態地將列添加到數據庫 在數據管理中,SQL的適應性至關重要。 需要即時調整數據庫結構嗎? Alter表語句是您的解決方案。本指南的詳細信息添加了Colu

閱讀AI索引2025:AI是您的朋友,敵人還是副駕駛? 閱讀AI索引2025:AI是您的朋友,敵人還是副駕駛? Apr 11, 2025 pm 12:13 PM

斯坦福大學以人為本人工智能研究所發布的《2025年人工智能指數報告》對正在進行的人工智能革命進行了很好的概述。讓我們用四個簡單的概念來解讀它:認知(了解正在發生的事情)、欣賞(看到好處)、接納(面對挑戰)和責任(弄清我們的責任)。 認知:人工智能無處不在,並且發展迅速 我們需要敏銳地意識到人工智能發展和傳播的速度有多快。人工智能係統正在不斷改進,在數學和復雜思維測試中取得了優異的成績,而就在一年前,它們還在這些測試中慘敗。想像一下,人工智能解決複雜的編碼問題或研究生水平的科學問題——自2023年

See all articles