英偉達獨霸時代結束? ChatGPT引爆谷歌微軟晶片大戰,亞馬遜也入局
ChatGPT爆火之後,Google和微軟兩巨頭的AI大戰戰火,已經燒到了新的領域-伺服器晶片。
如今,AI和雲端運算都成了必爭之地,而晶片,也成為降低成本、贏得商業客戶的關鍵。
原本,亞馬遜、微軟、Google這類大廠,都是以軟體聞名的,而現在,它們紛紛斥資數十億美元,用於晶片開發和生產。
各大科技巨擘研發的AI晶片
ChatGPT爆火,大廠開啟晶片爭霸賽
根據外媒The Information的報道以及其他來源,這三家大廠現在已經推出或計劃發布8款伺服器和AI晶片,用於內部產品開發、雲端伺服器租賃或二者兼有。
「如果你能製造出針對AI進行優化的矽,那前方等待你的將是巨大的勝利」,研究公司Forrester的董事Glenn O’Donnell這樣說。
付出這些巨大的努力,一定會得到回報嗎?
答案是,不一定。
Intel、AMD和英偉達可以從規模經濟中獲益,但對大型科技公司來說,情況遠非如此。
它們還面臨著許多棘手的挑戰,例如需要聘請晶片設計師,還要說服開發者使用他們定制的晶片來建立應用程式。
不過,大廠們已經在這一領域取得了令人矚目的進步。
根據公佈的性能數據,亞馬遜的Graviton伺服器晶片,以及亞馬遜和Google發布的AI專用晶片,在性能上已經可以和傳統的晶片廠商相媲美。
亞馬遜、微軟和Google為其資料中心開發的晶片,主要有這兩種:標準運算晶片和用於訓練和運行機器學習模型的專用晶片。正是後者,為ChatGPT之類的大語言模型提供了動力。
先前,蘋果成功地為iPhone,iPad和Mac開發了晶片,改善了一些AI任務的處理。這些大廠,或許正是跟蘋果學來的靈感。
在三家大廠中,亞馬遜是唯一一家在伺服器中提供兩種晶片的雲端服務商,2015年收購的以色列晶片設計商Annapurna Labs,為這些工作奠定了基礎。
Google在2015年推出了一款用於AI工作負載的晶片,並正在開發一款標準伺服器晶片,以提高Google雲端的伺服器效能。
相較之下,微軟的晶片研發開始得較晚,是在2019年啟動的,而最近,微軟更加快了推出專為LLM設計的AI晶片的時間軸。
而ChatGPT的爆火,點燃了全世界用戶對於AI的興奮。這更促進了三家大廠的策略轉型。
ChatGPT運行在微軟的Azure雲端上,使用了上萬塊英偉達A100。無論是ChatGPT,還是其他整合進Bing和各種程式的OpenAI軟體,都需要如此多的算力,以至於微軟已經為開發AI的內部團隊分配了伺服器硬體。
在亞馬遜,財務長Brian Olsavsky在上週的財報電話會議上告訴投資者,亞馬遜計劃將支出從零售業務轉移到AWS,部分原因是投資於支持ChatGPT所需的基礎設施。
在谷歌,負責製造張量處理單元的工程團隊已經轉移到Google雲端。據悉,雲端組織現在可以為TPU和在其上運行的軟體製定路線圖,希望讓雲端客戶租用更多TPU驅動的伺服器。
Google:為AI特調的TPU V4
早在2020年,Google就在自家的資料中心上部署了當時最強的AI晶片— TPU v4。
不過直到今年的4月4日,Google才首次公佈了這台AI超算的技術細節。
比起TPU v3,TPU v4的效能高出2.1倍,而在整合4096個晶片之後,超算的性能更是提升了10倍。
同時,Google也聲稱,自家晶片要比英偉達A100更快、更節能。對於規模相當的系統,TPU v4可以提供比英偉達A100強1.7倍的效能,同時在能源效率上也能提升1.9倍。
對於相似規模的系統,TPU v4在BERT上比A100快1.15倍,比IPU快約4.3倍。對於ResNet,TPU v4分別快速1.67倍和約4.5倍。
另外,Google曾暗示,它正在研發一款與Nvidia H100競爭的新TPU。谷歌研究員Jouppi接受路透社採訪時表示,Google擁有「未來晶片的生產線」。
微軟:秘密武器雅典娜
不管怎麼說,微軟在這場晶片紛爭中,依舊躍躍欲試。
先前有消息爆出,微軟秘密組成的300人團隊,在2019年時就開始研發一款名為「雅典娜」(Athena)的客製化晶片。
根據最初的計劃,「雅典娜」會使用台積電的5nm工藝打造,預計可以將每顆晶片的成本降低1/3。
如果在明年能夠大面積實裝,微軟內部和OpenAI的團隊便可以藉助「雅典娜」同時完成模型的訓練和推理。
這樣一來,就可以大幅緩解專用電腦緊缺的問題。
彭博社在上週的報導中,稱微軟的晶片部門已與AMD合作開發雅典娜晶片,這也導致AMD的股價在周四上漲了6.5%。
但一位知情者表示,AMD並未參與其中,而是在開發自己的GPU,與英偉達競爭,並且AMD一直在與微軟討論晶片的設計,因為微軟預計要買這款GPU。
亞馬遜:已搶跑一個身位
而在與微軟和Google的晶片競賽中,亞馬遜似乎已經領先了一個身位。
在過去的十年中,亞馬遜在雲端運算服務方面,透過提供更先進的技術和更低的價格,一直保持了對微軟和谷歌的競爭優勢。
而未來十年內,亞馬遜也有望透過自己內部開發的伺服器晶片——Graviton,繼續在競爭中保持優勢。
作為最新一代的處理器,AWS Graviton3在運算效能上比上一代提高多達25%,浮點效能提高多達2倍。並支援DDR5內存,相比DDR4內存頻寬增加了50%。
針對機器學習工作負載,AWS Graviton3比上一代的效能高出多達3倍,並支援 bfloat16。
基於Graviton 3晶片的雲端服務在某些地區非常受歡迎,甚至於達到了供不應求的狀態。
亞馬遜另一方面的優勢也表現在,它是目前唯一一家在其伺服器中提供標準運算晶片(Graviton)和AI專用晶片(Inferentia和Trainium)雲端供應商。
早在2019年,亞馬遜就推出了自己的AI推理晶片——Inferentia。
它可以讓客戶可以在雲端低成本運行大規模機器學習推理應用程序,例如圖像識別、語音識別、自然語言處理、個性化和欺詐檢測。
而最新的Inferentia 2更是在運算效能提高了3倍,加速器總記憶體擴大了4倍,吞吐量提高了4倍,延遲降低到1/10。
在第一代Inferentia推出之後,亞馬遜又發布了其設計的主要用於AI訓練的客製化晶片—— Trainium。
它對深度學習訓練工作負載進行了最佳化,包括圖像分類、語義搜尋、翻譯、語音辨識、自然語言處理和推薦引擎等。
在某些情況下,晶片客製化不僅可以把成本降低一個數量級,能耗減少到1/10 ,而這些客製化的方案可以給客戶以更低的延遲提供更好的服務。
撼動英偉達的壟斷,沒那麼容易
不過到目前為止,大多數的AI負載還是跑在GPU上的,而英偉達生產了其中的大部分晶片。
據先前通報,英偉達獨立GPU市佔率達80%,在高階GPU市佔率高達90%。
20年,全世界跑AI的雲端運算與資料中心,80.6%都由英偉達GPU驅動。 21年,英偉達表示,全球前500個超算中,大約七成是由自家的晶片驅動。
而現在,就連運行ChatGPT的微軟資料中心用了上萬塊英偉達A100 GPU。
一直以來,不管是成為頂流的ChatGPT,還是Bard、Stable Diffusion等模型,背後都是由每個大約價值1萬美元的晶片英偉達A100提供算力。
不僅如此,A100目前已成為人工智慧專業人士的「主力」。 2022人工智慧現況報告也列出了使用A100超級電腦部分公司的名單。
顯而易見,《英偉達已經壟斷了全球算力,憑藉著自家的晶片,一統江湖。
根據從業者的說法,相較於通用晶片,亞馬遜、Google和微軟一直在研發的專用積體電路(ASIC)晶片,在執行機器學習任務的速度更快,功耗更低。
O'Donnell董事在比較GPU和ASIC時,用了這樣一個比較:「平常開車,你可以用普銳斯,但如果你必須在山上用四輪驅動,用吉普牧馬人就會更合適。
然而儘管已經做出了種種努力,但亞馬遜、Google和微軟都面臨著挑戰——如何說服開發者使用這些AI晶片呢?
現在,英偉達的GPU是主導的,開發者早已熟悉其專有的程式語言CUDA,用於製作GPU驅動的應用程式。
如果換到亞馬遜、Google或微軟的客製化晶片,就需要學習全新的軟體語言了,他們會願意嗎?
以上是英偉達獨霸時代結束? ChatGPT引爆谷歌微軟晶片大戰,亞馬遜也入局的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

熱門話題

本文介紹如何在Debian系統上自定義Apache的日誌格式。以下步驟將指導您完成配置過程:第一步:訪問Apache配置文件Debian系統的Apache主配置文件通常位於/etc/apache2/apache2.conf或/etc/apache2/httpd.conf。使用以下命令以root權限打開配置文件:sudonano/etc/apache2/apache2.conf或sudonano/etc/apache2/httpd.conf第二步:定義自定義日誌格式找到或

Tomcat日誌是診斷內存洩漏問題的關鍵。通過分析Tomcat日誌,您可以深入了解內存使用情況和垃圾回收(GC)行為,從而有效定位和解決內存洩漏。以下是如何利用Tomcat日誌排查內存洩漏:1.GC日誌分析首先,啟用詳細的GC日誌記錄。在Tomcat啟動參數中添加以下JVM選項:-XX: PrintGCDetails-XX: PrintGCDateStamps-Xloggc:gc.log這些參數會生成詳細的GC日誌(gc.log),包含GC類型、回收對像大小和時間等信息。分析gc.log

在Debian系統中,readdir函數用於讀取目錄內容,但其返回的順序並非預先定義的。要對目錄中的文件進行排序,需要先讀取所有文件,再利用qsort函數進行排序。以下代碼演示瞭如何在Debian系統中使用readdir和qsort對目錄文件進行排序:#include#include#include#include//自定義比較函數,用於qsortintcompare(constvoid*a,constvoid*b){returnstrcmp(*(

在Debian系統中,readdir系統調用用於讀取目錄內容。如果其性能表現不佳,可嘗試以下優化策略:精簡目錄文件數量:盡可能將大型目錄拆分成多個小型目錄,降低每次readdir調用處理的項目數量。啟用目錄內容緩存:構建緩存機制,定期或在目錄內容變更時更新緩存,減少對readdir的頻繁調用。內存緩存(如Memcached或Redis)或本地緩存(如文件或數據庫)均可考慮。採用高效數據結構:如果自行實現目錄遍歷,選擇更高效的數據結構(例如哈希表而非線性搜索)存儲和訪問目錄信

本文介紹如何在Debian系統中使用iptables或ufw配置防火牆規則,並利用Syslog記錄防火牆活動。方法一:使用iptablesiptables是Debian系統中功能強大的命令行防火牆工具。查看現有規則:使用以下命令查看當前的iptables規則:sudoiptables-L-n-v允許特定IP訪問:例如,允許IP地址192.168.1.100訪問80端口:sudoiptables-AINPUT-ptcp--dport80-s192.16

Debian系統中的readdir函數是用於讀取目錄內容的系統調用,常用於C語言編程。本文將介紹如何將readdir與其他工具集成,以增強其功能。方法一:C語言程序與管道結合首先,編寫一個C程序調用readdir函數並輸出結果:#include#include#includeintmain(intargc,char*argv[]){DIR*dir;structdirent*entry;if(argc!=2){

本指南將指導您學習如何在Debian系統中使用Syslog。 Syslog是Linux系統中用於記錄系統和應用程序日誌消息的關鍵服務,它幫助管理員監控和分析系統活動,從而快速識別並解決問題。一、Syslog基礎知識Syslog的核心功能包括:集中收集和管理日誌消息;支持多種日誌輸出格式和目標位置(例如文件或網絡);提供實時日誌查看和過濾功能。二、安裝和配置Syslog(使用Rsyslog)Debian系統默認使用Rsyslog。您可以通過以下命令安裝:sudoaptupdatesud

Debian系統中,Nginx的訪問日誌和錯誤日誌默認存儲位置如下:訪問日誌(accesslog):/var/log/nginx/access.log錯誤日誌(errorlog):/var/log/nginx/error.log以上路徑是標準DebianNginx安裝的默認配置。如果您在安裝過程中修改過日誌文件存放位置,請檢查您的Nginx配置文件(通常位於/etc/nginx/nginx.conf或/etc/nginx/sites-available/目錄下)。在配置文件中
