在2024年4月15日消息,Gartner最近發布的一份2024年CIO和技術高管調查顯示,超過60%的中國企業計劃在未來12至24個月內部署生成式人工智慧(GenAI)。由於中國企業傾向於在本地而非透過公有雲部署GenAI,目前的基礎設施環境無法支援GenAI專案。這將推動中國企業資料中心的設計轉型。
Gartner研究總監張呂鏿表示:「由於安全和資料隱私方面的擔憂以及監管要求,一些企業更傾向於在本地部署GenAl解決方案或微調大語言模型(LLM)。在本地部署GenAl對於資料中心來說並非簡單的託管需求,而是可能改變企業資料中心的策略,因為模型訓練需要大規模的GPU叢集。方法(見圖1)。根據企業選擇的GenAI部署方法,中國的資訊長(CIO)及基礎設施和營運(I&O)領導者需要了解GenAI部署的影響以及如何採取行動。
圖1:生成式人工智慧部署的五種方法
#Gartner:生成式AI將推動中國企業資料中心設計轉型中國的CIO及I&O領導者須為應對這項技術對資料中心的影響做好準備。
本地部署GenAI將迫使I&O領導者改變託管環境的設計方式
部署GenAI對資料中心的影響決定了所執行的工作負載類型,因為某些GenAI工作負載需要使用高階圖形處理器(GPU)。由於中國市場上的高階GPU供應有限,I&O領導者需要在本地部署GenAI就需要改變託管環境的設計方式。
I&O領導者無法獨自解決供應短缺問題,必須與業務、AI工程師和職能團隊合作應對這項挑戰。
張吟鈴表示:「為GenAl的部署準備基礎設施資源的中國CIO及I&O領導者應該主動與業務及相關團隊合作,預測不同工作負載對資料中心的成本和時間表的影響,從而為GenAl的部署制定資料中心宏觀策略。
#部署大規模GPU集群需要改造並升級資料中心基礎設施和設備從零開始建立基礎模型或微調模型需要部署大規模GPU集群,這將對現有資料中心帶來顛覆。因為GenAI模型的訓練需要高吞吐量、低延遲和無損的基礎設施。為了支援此類高效能運算集群,必須對網路、儲存、電力供應和冷卻系統進行升級。在某些情況下,需要對現有設施進行改造,以承載升級後的基礎設施(見圖2)。 圖2:大規模GPU叢集對資料中心的影響張吟鈴表示:「中國CIO及I&O領導者需要與資料科學家和工程師合作,明確GPU叢集規模和GenAI效能要求,從而確定網路和儲存等方面的基礎設施要求。
#
以上是Gartner:生成式AI將推動中國企業資料中心設計轉型的詳細內容。更多資訊請關注PHP中文網其他相關文章!