如果您正在尋找有趣的話題,那麼人工智慧 (AI) 不會讓您失望。人工智慧包含一組強大的令人費解的統計演算法,可以下棋、破解潦草的筆跡、理解語音、分類衛星圖像等等。用於訓練機器學習模型的巨型資料集的可用性一直是人工智慧成功的關鍵因素之一。但所有這些計算工作都不是免費的。一些人工智慧專家越來越關注與建立新演算法相關的環境影響,這場辯論引發了關於如何讓機器更有效地學習以減少人工智慧碳足跡的新想法。
要深入了解細節,我們首先需要考慮數以千計的資料中心(遍布世界各地),它們24小時全天候處理我們的計算請求。對於人工智慧研究人員來說,這些任務包括訓練具有數十億個資料元素(或標記——在英語中相當於四個字元或大約 3/4 個單字的單字位)的多層演算法。所涉及的計算工作令人驚訝。人工智慧基礎設施公司 Lambda 提供了一些關於 GPT-3(OpenAI 用於生成類人文本的強大自然語言模型)的有趣事實。根據 Lambda 的分析,如果您希望在單一 NVIDIA RTX 8000 上訓練 GPT-3 的 1750 億參數模型,則需要 665 年,這在顯示卡方面毫不遜色。
簡單來說,模型越大,性能就越好,Lambda 的團隊指出,state-of-the-art 語言模型的規模每年以10 倍的速度增長,這讓我們回到了對AI增長的擔憂碳足跡。回到資料中心,有可能在討論中加入更多數字,至少在高層次上是如此。根據國際能源總署 (IEA) 的估計,全球資料中心的總用電量在 200 到 250 TWh 之間。為了讓這個數字更容易視覺化,假設機車和機車車輛平均每公里行駛消耗 2.5 千瓦時,225 太瓦時足以讓高速電動火車行駛 900 萬公里。雖然只有一部分(在資料中心)將用於訓練和運行 AI 模型,但消息來源表明,機器學習和訓練的運算需求正在超過資料中心活動的平均成長速度。
在這一點上,公平地承認資料中心在管理其能源需求方面做得很好——環境問題是一個動力,但值得一提的是,電力是一項重大的營運費用,對每個設施來說都是「關鍵任務」 .儘管全球互聯網流量激增,僅在2020 年就增長了40%,但數據中心的能源使用在過去十年中保持相對穩定。 「資料中心服務需求的強勁成長繼續被伺服器、儲存設備、網路交換器和資料中心基礎設施的持續效率提升以及高效雲端和超大規模資料所滿足的服務份額不斷增長所抵消。中心,」IEA 寫道。
此外,垂直整合的資料中心營運商,如亞馬遜、Google、Facebook 等,很快就會補充說他們的設施由再生能源供電。自然地,這減輕了數據處理對環境造成的負擔,因為為計算硬體機架和必要的輔助服務(如加熱、冷卻和照明)供電的電力可以來自太陽和風。然而,正如《金融時報》未選擇的那樣,即使資料中心能源協議可能透過再生能源抵消其 100% 的電力消耗,但在風能和太陽能不可用時,設施可能仍會消耗化石燃料。還需要考慮計算設備本身的嵌入式碳排放,這是因為製造方法和零件材料採購活動也會產生碳排放——微軟承認這一點。
今年早些時候,微軟在最近的一篇部落格文章中討論了高效模型訓練的話題。開發人員正忙於探索縮小人工智慧碳足跡的方法——或至少抑制其成長。這裡的步驟包括尋找在模型微調期間減少計算和記憶體需求的方法,建議在過程的這個階段將 GPU 使用量減少三倍。模型壓縮也顯示出了希望,其中 AI 資料的子層被修剪成更稀疏但仍具有代表性的先前組合條件的版本。在這裡,研究表明,壓縮模型可能需要減少約 40% 的訓練時間,同時實現類似的演算法效果。
開發人員也可以從監控工具中受益,這些工具將找出透過最佳化程式碼或資料託管安排所獲得的效益。 「CodeCarbon 是一個輕量級的軟體包,可以無縫整合到你的 Python 程式碼庫中,」免費提供他們的工具的發明者寫道。 「它估計了用於執行程式碼的雲端或個人運算資源產生的二氧化碳 (CO2) 量。」
循環往復,未來可能會部署更節能的人工智慧,以幫助指導更高效的資料中心運營,以降低——你猜對了——人工智慧的碳足跡。如今,Cirrus Nexus 提供了可用的軟體,資料中心營運商可以使用該軟體來為碳分配成本,並透過人工智慧演算法傳播。結果不僅顯示了二氧化碳計算,還提供了對用戶可以配置其設施以最大化可用環境收益的方式的洞察。
使支援當今技術的演算法的碳足跡可見,這在多個方面都有幫助。它正在就培訓未來人工智慧最有效的方式展開討論,讓 IT 部門及其客戶對運算的環境成本承擔更多責任。最後,它可能對企業有利。引人注目的是,亞馬遜今年稍早發布了客戶碳足跡工具,Google等其他大公司也允許客戶匯出雲端碳排放資訊——這項服務目前處於預覽階段。
以上是計算人工智慧的碳成本的詳細內容。更多資訊請關注PHP中文網其他相關文章!