計算人工智慧的碳成本
如果您正在尋找有趣的話題,那麼人工智慧 (AI) 不會讓您失望。人工智慧包含一組強大的令人費解的統計演算法,可以下棋、破解潦草的筆跡、理解語音、分類衛星圖像等等。用於訓練機器學習模型的巨型資料集的可用性一直是人工智慧成功的關鍵因素之一。但所有這些計算工作都不是免費的。一些人工智慧專家越來越關注與建立新演算法相關的環境影響,這場辯論引發了關於如何讓機器更有效地學習以減少人工智慧碳足跡的新想法。
回到地球
要深入了解細節,我們首先需要考慮數以千計的資料中心(遍布世界各地),它們24小時全天候處理我們的計算請求。對於人工智慧研究人員來說,這些任務包括訓練具有數十億個資料元素(或標記——在英語中相當於四個字元或大約 3/4 個單字的單字位)的多層演算法。所涉及的計算工作令人驚訝。人工智慧基礎設施公司 Lambda 提供了一些關於 GPT-3(OpenAI 用於生成類人文本的強大自然語言模型)的有趣事實。根據 Lambda 的分析,如果您希望在單一 NVIDIA RTX 8000 上訓練 GPT-3 的 1750 億參數模型,則需要 665 年,這在顯示卡方面毫不遜色。
簡單來說,模型越大,性能就越好,Lambda 的團隊指出,state-of-the-art 語言模型的規模每年以10 倍的速度增長,這讓我們回到了對AI增長的擔憂碳足跡。回到資料中心,有可能在討論中加入更多數字,至少在高層次上是如此。根據國際能源總署 (IEA) 的估計,全球資料中心的總用電量在 200 到 250 TWh 之間。為了讓這個數字更容易視覺化,假設機車和機車車輛平均每公里行駛消耗 2.5 千瓦時,225 太瓦時足以讓高速電動火車行駛 900 萬公里。雖然只有一部分(在資料中心)將用於訓練和運行 AI 模型,但消息來源表明,機器學習和訓練的運算需求正在超過資料中心活動的平均成長速度。
在這一點上,公平地承認資料中心在管理其能源需求方面做得很好——環境問題是一個動力,但值得一提的是,電力是一項重大的營運費用,對每個設施來說都是「關鍵任務」 .儘管全球互聯網流量激增,僅在2020 年就增長了40%,但數據中心的能源使用在過去十年中保持相對穩定。 「資料中心服務需求的強勁成長繼續被伺服器、儲存設備、網路交換器和資料中心基礎設施的持續效率提升以及高效雲端和超大規模資料所滿足的服務份額不斷增長所抵消。中心,」IEA 寫道。
光子等等
此外,垂直整合的資料中心營運商,如亞馬遜、Google、Facebook 等,很快就會補充說他們的設施由再生能源供電。自然地,這減輕了數據處理對環境造成的負擔,因為為計算硬體機架和必要的輔助服務(如加熱、冷卻和照明)供電的電力可以來自太陽和風。然而,正如《金融時報》未選擇的那樣,即使資料中心能源協議可能透過再生能源抵消其 100% 的電力消耗,但在風能和太陽能不可用時,設施可能仍會消耗化石燃料。還需要考慮計算設備本身的嵌入式碳排放,這是因為製造方法和零件材料採購活動也會產生碳排放——微軟承認這一點。
今年早些時候,微軟在最近的一篇部落格文章中討論了高效模型訓練的話題。開發人員正忙於探索縮小人工智慧碳足跡的方法——或至少抑制其成長。這裡的步驟包括尋找在模型微調期間減少計算和記憶體需求的方法,建議在過程的這個階段將 GPU 使用量減少三倍。模型壓縮也顯示出了希望,其中 AI 資料的子層被修剪成更稀疏但仍具有代表性的先前組合條件的版本。在這裡,研究表明,壓縮模型可能需要減少約 40% 的訓練時間,同時實現類似的演算法效果。
開發人員也可以從監控工具中受益,這些工具將找出透過最佳化程式碼或資料託管安排所獲得的效益。 「CodeCarbon 是一個輕量級的軟體包,可以無縫整合到你的 Python 程式碼庫中,」免費提供他們的工具的發明者寫道。 「它估計了用於執行程式碼的雲端或個人運算資源產生的二氧化碳 (CO2) 量。」
完整的循環
循環往復,未來可能會部署更節能的人工智慧,以幫助指導更高效的資料中心運營,以降低——你猜對了——人工智慧的碳足跡。如今,Cirrus Nexus 提供了可用的軟體,資料中心營運商可以使用該軟體來為碳分配成本,並透過人工智慧演算法傳播。結果不僅顯示了二氧化碳計算,還提供了對用戶可以配置其設施以最大化可用環境收益的方式的洞察。
使支援當今技術的演算法的碳足跡可見,這在多個方面都有幫助。它正在就培訓未來人工智慧最有效的方式展開討論,讓 IT 部門及其客戶對運算的環境成本承擔更多責任。最後,它可能對企業有利。引人注目的是,亞馬遜今年稍早發布了客戶碳足跡工具,Google等其他大公司也允許客戶匯出雲端碳排放資訊——這項服務目前處於預覽階段。
以上是計算人工智慧的碳成本的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

熱門話題

本站6月27日訊息,剪映是由位元組跳動旗下臉萌科技開發的一款影片剪輯軟體,依託於抖音平台且基本面向該平台用戶製作短影片內容,並相容於iOS、安卓、Windows 、MacOS等作業系統。剪映官方宣布會員體系升級,推出全新SVIP,包含多種AI黑科技,例如智慧翻譯、智慧劃重點、智慧包裝、數位人合成等。價格方面,剪映SVIP月費79元,年費599元(本站註:折合每月49.9元),連續包月則為59元每月,連續包年為499元每年(折合每月41.6元) 。此外,剪映官方也表示,為提升用戶體驗,向已訂閱了原版VIP

透過將檢索增強生成和語意記憶納入AI編碼助手,提升開發人員的生產力、效率和準確性。譯自EnhancingAICodingAssistantswithContextUsingRAGandSEM-RAG,作者JanakiramMSV。雖然基本AI程式設計助理自然有幫助,但由於依賴對軟體語言和編寫軟體最常見模式的整體理解,因此常常無法提供最相關和正確的程式碼建議。這些編碼助手產生的代碼適合解決他們負責解決的問題,但通常不符合各個團隊的編碼標準、慣例和風格。這通常會導致需要修改或完善其建議,以便將程式碼接受到應

大型語言模型(LLM)是在龐大的文字資料庫上訓練的,在那裡它們獲得了大量的實際知識。這些知識嵌入到它們的參數中,然後可以在需要時使用。這些模型的知識在訓練結束時被「具體化」。在預訓練結束時,模型實際上停止學習。對模型進行對齊或進行指令調優,讓模型學習如何充分利用這些知識,以及如何更自然地回應使用者的問題。但是有時模型知識是不夠的,儘管模型可以透過RAG存取外部內容,但透過微調使用模型適應新的領域被認為是有益的。這種微調是使用人工標註者或其他llm創建的輸入進行的,模型會遇到額外的實際知識並將其整合

想了解更多AIGC的內容,請造訪:51CTOAI.x社群https://www.51cto.com/aigc/譯者|晶顏審校|重樓不同於網路上隨處可見的傳統問題庫,這些問題需要跳脫常規思維。大語言模型(LLM)在數據科學、生成式人工智慧(GenAI)和人工智慧領域越來越重要。這些複雜的演算法提升了人類的技能,並在許多產業中推動了效率和創新性的提升,成為企業保持競爭力的關鍵。 LLM的應用範圍非常廣泛,它可以用於自然語言處理、文字生成、語音辨識和推薦系統等領域。透過學習大量的數據,LLM能夠產生文本

編輯|ScienceAI問答(QA)資料集在推動自然語言處理(NLP)研究中發揮著至關重要的作用。高品質QA資料集不僅可以用於微調模型,也可以有效評估大語言模型(LLM)的能力,尤其是針對科學知識的理解和推理能力。儘管目前已有許多科學QA數據集,涵蓋了醫學、化學、生物等領域,但這些數據集仍有一些不足之處。其一,資料形式較為單一,大多數為多項選擇題(multiple-choicequestions),它們易於進行評估,但限制了模型的答案選擇範圍,無法充分測試模型的科學問題解答能力。相比之下,開放式問答

01前景概要目前,難以在檢測效率和檢測結果之間取得適當的平衡。我們研究了一種用於高解析度光學遙感影像中目標偵測的增強YOLOv5演算法,利用多層特徵金字塔、多重偵測頭策略和混合注意力模組來提高光學遙感影像的目標偵測網路的效果。根據SIMD資料集,新演算法的mAP比YOLOv5好2.2%,比YOLOX好8.48%,在偵測結果和速度之間達到了更好的平衡。 02背景&動機隨著遠感技術的快速發展,高解析度光學遠感影像已被用於描述地球表面的許多物體,包括飛機、汽車、建築物等。目標檢測在遠感影像的解釋中

機器學習是人工智慧的重要分支,它賦予電腦從數據中學習的能力,並能夠在無需明確編程的情況下改進自身能力。機器學習在各個領域都有廣泛的應用,從影像辨識和自然語言處理到推薦系統和詐欺偵測,它正在改變我們的生活方式。機器學習領域存在著多種不同的方法和理論,其中最具影響力的五種方法被稱為「機器學習五大派」。這五大派分別為符號派、聯結派、進化派、貝葉斯派和類推學派。 1.符號學派符號學(Symbolism),又稱符號主義,強調利用符號進行邏輯推理和表達知識。該學派認為學習是一種逆向演繹的過程,透過現有的

編輯|KX在藥物研發領域,準確有效地預測蛋白質與配體的結合親和力對於藥物篩選和優化至關重要。然而,目前的研究並沒有考慮到分子表面訊息在蛋白質-配體相互作用中的重要作用。基於此,來自廈門大學的研究人員提出了一種新穎的多模態特徵提取(MFE)框架,該框架首次結合了蛋白質表面、3D結構和序列的信息,並使用交叉注意機制進行不同模態之間的特徵對齊。實驗結果表明,該方法在預測蛋白質-配體結合親和力方面取得了最先進的性能。此外,消融研究證明了該框架內蛋白質表面資訊和多模態特徵對齊的有效性和必要性。相關研究以「S
