IBM開發雲端原生AI超級電腦Vela 可靈活部署並訓練數百億參數模型
ChatGPT紅遍網絡,其背後的AI模型訓練也廣受關注。 IBM研究部門日前宣布,其開發的雲端原生超級電腦Vela可以快速部署並用於訓練基礎AI模型。自2022年5月以來,該公司數十名研究人員一直在使用這款超級電腦訓練具有數百億參數的AI模型。
基礎模型是基於大量未標記資料訓練的AI模型,它們的通用性意味著只需微調即可用於一系列不同的任務。它們的規模非常龐大,需要大量且成本高昂的運算能力。因此正如專家表示,運算能力將成為開發下一代大規模基礎模型的最大瓶頸,訓練它們需要花費大量算力和時間。
訓練可以運行數百億個或數千億個參數的模型,需要採用高效能的運算硬件,包括網路、平行檔案系統和裸機節點等。這些硬體很難部署,運作成本也很高。微軟於2020年5月為OpenAI建造了AI超級計算機,並託管在Azure雲端平台中。但IBM表示,它們是由硬體驅動的,這增加了成本,並限制了靈活性。
雲端AI超級電腦
因此,IBM創建了名為Vela的「專門專注於大規模AI」的系統。
Vela可以根據需要部署到IBM的任何一個雲端資料中心中,它本身就是一個「虛擬雲」。與構建物理的超級電腦相比,雖然這種方法在計算能力方面有所下降,但創造了一個更靈活的解決方案。雲端運算解決方案透過API介面為工程師提供資源,更方便地存取廣泛的IBM雲端生態系統以進行更深入的集成,並能夠根據需要擴展效能。
IBM工程師解釋說,Vela能夠存取IBM雲端物件儲存上的資料集,而不是建立自訂儲存後端。以往這些基礎設施必須單獨建置到超級電腦中。
任何AI超級電腦的關鍵組成部分都是大量的GPU以及連接它們的節點。 Vela其實是將每個節點配置為虛擬機器(而不是裸機),這是最常見的方法,也被廣泛認為是AI訓練最理想的方法。
Vela是如何建構的?
雲端虛擬電腦的弊病之一是效能無法保證。為了解決效能下降問題,並在虛擬機器內部提供裸機效能,IBM工程師找到了一種釋放全部節點效能(包括GPU、CPU、網路和儲存),並將負載損耗降低到5%以下的方法。
這涉及到為虛擬化配置裸機主機,支援虛擬機擴展、大型頁面和單根IO虛擬化,以及真實地表示虛擬機內的所有設備和連接;還包括網卡與CPU和GPU匹配,以及它們彼此之間如何橋接起來。完成這些工作後,他們發現虛擬機器節點的效能「接近裸機」。
此外,他們還致力於設計具有大型GPU記憶體和大量本地儲存的AI節點,用於快取AI訓練資料、模型和成品。在使用PyTorch的測試中,他們發現透過優化工作負載通訊模式,與超級運算中使用的類似Infiniband的更快的網路相比,他們還能夠彌補乙太網路相對較慢的瓶頸。
配置方面,每個Vela都採用了8個80GB A100 GPU、兩個第二代Intel Xeon可擴展處理器、1.5TB內存和四個3.2TB NVMe硬碟驅動器,並能夠以任何規模部署到IBM在全球的任何一個雲端資料中心。
IBM的工程師表示:「擁有合適的工具和基礎設施是提高研發效率的關鍵因素。許多團隊選擇遵循為AI構建傳統超級電腦的可靠路徑…我們一直在研究一種更好的解決方案,以提供高效能運算和高階用戶生產力的雙重好處。」
########以上是IBM開發雲端原生AI超級電腦Vela 可靈活部署並訓練數百億參數模型的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

熱門話題

本文介紹如何在Debian系統上自定義Apache的日誌格式。以下步驟將指導您完成配置過程:第一步:訪問Apache配置文件Debian系統的Apache主配置文件通常位於/etc/apache2/apache2.conf或/etc/apache2/httpd.conf。使用以下命令以root權限打開配置文件:sudonano/etc/apache2/apache2.conf或sudonano/etc/apache2/httpd.conf第二步:定義自定義日誌格式找到或

Tomcat日誌是診斷內存洩漏問題的關鍵。通過分析Tomcat日誌,您可以深入了解內存使用情況和垃圾回收(GC)行為,從而有效定位和解決內存洩漏。以下是如何利用Tomcat日誌排查內存洩漏:1.GC日誌分析首先,啟用詳細的GC日誌記錄。在Tomcat啟動參數中添加以下JVM選項:-XX: PrintGCDetails-XX: PrintGCDateStamps-Xloggc:gc.log這些參數會生成詳細的GC日誌(gc.log),包含GC類型、回收對像大小和時間等信息。分析gc.log

在Debian系統中,readdir函數用於讀取目錄內容,但其返回的順序並非預先定義的。要對目錄中的文件進行排序,需要先讀取所有文件,再利用qsort函數進行排序。以下代碼演示瞭如何在Debian系統中使用readdir和qsort對目錄文件進行排序:#include#include#include#include//自定義比較函數,用於qsortintcompare(constvoid*a,constvoid*b){returnstrcmp(*(

在Debian系統中,readdir系統調用用於讀取目錄內容。如果其性能表現不佳,可嘗試以下優化策略:精簡目錄文件數量:盡可能將大型目錄拆分成多個小型目錄,降低每次readdir調用處理的項目數量。啟用目錄內容緩存:構建緩存機制,定期或在目錄內容變更時更新緩存,減少對readdir的頻繁調用。內存緩存(如Memcached或Redis)或本地緩存(如文件或數據庫)均可考慮。採用高效數據結構:如果自行實現目錄遍歷,選擇更高效的數據結構(例如哈希表而非線性搜索)存儲和訪問目錄信

本文介紹如何在Debian系統中使用iptables或ufw配置防火牆規則,並利用Syslog記錄防火牆活動。方法一:使用iptablesiptables是Debian系統中功能強大的命令行防火牆工具。查看現有規則:使用以下命令查看當前的iptables規則:sudoiptables-L-n-v允許特定IP訪問:例如,允許IP地址192.168.1.100訪問80端口:sudoiptables-AINPUT-ptcp--dport80-s192.16

Debian系統中,Nginx的訪問日誌和錯誤日誌默認存儲位置如下:訪問日誌(accesslog):/var/log/nginx/access.log錯誤日誌(errorlog):/var/log/nginx/error.log以上路徑是標準DebianNginx安裝的默認配置。如果您在安裝過程中修改過日誌文件存放位置,請檢查您的Nginx配置文件(通常位於/etc/nginx/nginx.conf或/etc/nginx/sites-available/目錄下)。在配置文件中

在Debian郵件服務器上安裝SSL證書的步驟如下:1.安裝OpenSSL工具包首先,確保你的系統上已經安裝了OpenSSL工具包。如果沒有安裝,可以使用以下命令進行安裝:sudoapt-getupdatesudoapt-getinstallopenssl2.生成私鑰和證書請求接下來,使用OpenSSL生成一個2048位的RSA私鑰和一個證書請求(CSR):openss

配置Debian郵件服務器的防火牆是確保服務器安全性的重要步驟。以下是幾種常用的防火牆配置方法,包括iptables和firewalld的使用。使用iptables配置防火牆安裝iptables(如果尚未安裝):sudoapt-getupdatesudoapt-getinstalliptables查看當前iptables規則:sudoiptables-L配置
