首頁 科技週邊 人工智慧 來自科技進步一等獎的肯定:騰訊破解萬億參數大模型訓練難題

來自科技進步一等獎的肯定:騰訊破解萬億參數大模型訓練難題

Mar 27, 2024 pm 09:41 PM
產業 騰訊雲

中國電子學會 2023 科學技術獎授獎名單公佈,這次,我們發現了一個熟悉的身影 —— 騰訊 Angel 機器學習平台。

在大模型快速發展的當下,科學技術獎授予機器學習平台類研究和應用項目,對於模型訓練平台的價值和重要性給予了充分的肯定。

來自科技進步一等獎的肯定:騰訊破解萬億參數大模型訓練難題

科學技術獎認可了機器學習平台類專案的研究和應用,特別在大型模型快速發展的背景下,對模型訓練平台的價值和重要性給予了充分的認可。

隨著深度學習的興起,各大公司開始意識到機器學習平台在發展人工智慧技術中的重要性。谷歌、微軟、英偉達等公司都推出了自己的機器學習平台,以加速人工智慧模式的訓練過程。這些平台為開發者提供了便利的支持,使他們能夠更快地建構和優化複雜的人工智慧系統。這種趨勢促使人們更加關注機器學習技術的發展,並為未來的人工智慧應用打下了堅實的基礎。

從2023年開始,大型模型的興起進一步推動了模型參數量的提升。各大公司紛紛推出了參數規模達到千億甚至萬億等級的模型,這些模型普遍採用深度神經網路結構。然而,這種發展也帶來了兩個核心痛點:模型分散式訓練的困難以及應用複雜性所帶來的模型設計挑戰。

為什麼是 Angel 機器學習平台?

詳解四大核心技術突破

由多名院士等權威專家組成的鑑定委員會認為, 騰訊Angel 機器學習平台技術複雜度高、研發難度大、創新性強,應用前景廣闊,整體技術達到國際先進水平,其中面向all-to-all 通訊的高效快取調度與管理技術、自適應預採樣與圖結構搜尋技術達到國際領先水準。

來自科技進步一等獎的肯定:騰訊破解萬億參數大模型訓練難題

                              騰訊Angel 平台架構圖片

來自科技進步一等獎的肯定:騰訊破解萬億參數大模型訓練難題

來自科技進步一等獎的肯定:騰訊破解萬億參數大模型訓練難題

來自科技進步一等獎的肯定:騰訊破解萬億參數大模型訓練難題##地說# * * *->>).架構,這種架構的特點是將儲存模型參數和執行模型計算這兩個任務分別在不同的伺服器上運行。透過增加更多的伺服器,可以支援更大規模、運算需求更高的模型。這種架構使得模型訓練過程更有效率,能夠處理大規模資料集和複雜模型運算。分散式參數伺服器的設計使得系統具有良好的擴充性和靈活性,能夠滿足不同規模和需求的機器學習任務。這種架構的優點在於可以有效地利用叢集資源,提高運算效率,並為使用者提供更快速、更

###面對海量資料和超大規模模型訓練需求,騰訊Angel 機器學習平台在網路通信與快取、模型儲存與調度、多模態模型與融合學習排序、大規模圖模型與結構搜尋技術等核心環節取得技術突破。 ###############為了提高訓練效率,TB 級機器學習模型通常採用分散式訓練方法,需要大量的參數和梯度同步,以1.8T 模型千卡訓練為例, IO 通訊量達到25TB, 耗時佔53%,此外,加上不同算力集群間的異質網路環境,通訊網路延遲不一,這些都對模型訓練過程中的通訊開銷提出了較高的要求。騰訊Angel 機器學習平台基於騰訊雲星脈網路的高效通訊與快取調度管理技術,可有效解決TB 級模型訓練通訊開銷大的問題,實現網路通訊耗時減少80%,分散式訓練效能達業界主流方案的2.5 倍。 ###############現有的算力條件下,儘管模型達到 TB 級,而主流 GPU 的顯存仍只有 80G,參數儲存有瓶頸。針對 TB 級模型訓練參數儲存困難的關鍵問題, 騰訊 Angel 機器學習平台提出了顯存主存統一視角儲存管理機制,實現模型儲存容量比業界增加 1 倍,訓練效能是業界主流方案 2 倍。 ############

大模型要向通用模型發展,離不開對多模態數據的處理支持,不同模態,例如文字、圖像、視頻等數據的對齊融合理解難度大。在多模態模型的訓練上, 騰訊 Angel 機器學習平台針對廣告場景,提出多模態融合學習的全連結排序廣告推薦技術,協助廣告回想率提升 40% 以上。

來自科技進步一等獎的肯定:騰訊破解萬億參數大模型訓練難題

另外,針對推薦系統導向的圖模型訓練,騰訊Angel 機器學習平台設計了圖節點特徵自適應圖網路結構搜尋技術,可自動輸出最佳結構,解決了TB 圖模型應用中「圖資料探勘難」 的問題,實現模型訓練效能提升28 倍,與業界比具有最適擴展性。

騰訊Angel 機器學習平台鍛造之路

#騰訊混元大模型擴展到萬億規模

作為騰訊人工智慧技術的基礎平台,騰訊Angel 平台誕生於2015 年,支援PS-Worker 分散式訓練, 以及十億參數LDA 模型的訓練。

2017 年,Angel 框架在 Github 開源,向開發者開放,同時,技術上,Angel 解決了異質網路下的通訊問題,效能進一步提升。 2019 年,在可擴展圖模型多模態理解技術取得突破,解決兆節點可擴展圖模型問題。 2021 年,提出 GPU 顯存統一視角儲存技術,解決大模型 參數儲存與效能問題。

在騰訊通用人工智慧大模型騰訊混元的打造中,騰訊 Angel 機器學習平台也扮演了重要角色。

2023 年 9 月,騰訊混元大模型正式對外亮相,預訓練語料超 2 萬億 tokens,具有強大的中文理解與創作能力、邏輯推理能力,以及可靠的任務執行能力。

面對建造騰訊混元大模型的需求,騰訊Angel 機器學習平台打造了自研的面向大模型訓練和推理的機器學習框架Angel PTM 和Angel HCF,支持單任務萬卡級別超大規模訓練和大規模推理服務部署。實現大模型訓練效率提升至主流開源框架的 2.6 倍,千億級大模型訓練可節省 50% 算力成本,升級後支援單任務萬卡級別超大規模訓練。在推理上,騰訊 Angel 機器學習平台推理速度提高了 1.3 倍,在騰訊混元大模型文生圖的應用中,推理耗時從原本的 10 秒縮短至 3 至 4 秒。

此外,Angel 還提供了從模型研發到應用落地的一站式平台,支援用戶透過API 介面或精調等方式快速呼叫騰訊混元大模型能力,加速大模型應用構建,騰訊會議、騰訊新聞、騰訊影片等超過400 個騰訊產品及場景都已接取騰訊混元內測。

騰訊混元透過採用混合專家模型 (MoE) 結構,已將模型擴展至萬億級參數規模,推動了性能提升和推理成本下降。作為通用模型,騰訊混元在中文表現上處於業界領先水平,尤其在文字生成、數理邏輯和多輪對話中表現表現卓越。目前,騰訊混元也積極發展多模態模型,以進一步加強文生圖和文生視訊能力。

騰訊大量的應用場景,為騰訊 Angel 機器學習平台的落地提供了實驗地。除了騰訊混元大模型,騰訊 Angel 機器學習平台也支援了騰訊廣告以及騰訊會議等產品,並透過騰訊雲端服務多個產業和企業客戶,協助各行各業的數位化和智慧化發展。

以騰訊廣告為例,採用騰訊Angel 機器學習平分散式訓練優化、多模態理解圖資料探勘等創新技術,廣告業務場景中的多模態大模型訓練速度提升5 倍,模型規模提升10 倍,實現廣告回想率大幅提升。

以上是來自科技進步一等獎的肯定:騰訊破解萬億參數大模型訓練難題的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

DeepMind機器人打乒乓球,正手、反手溜到飛起,全勝人類初學者 DeepMind機器人打乒乓球,正手、反手溜到飛起,全勝人類初學者 Aug 09, 2024 pm 04:01 PM

但可能打不過公園裡的老大爺?巴黎奧運正在如火如荼地進行中,乒乓球項目備受關注。同時,機器人打乒乓球也取得了新突破。剛剛,DeepMind提出了第一個在競技乒乓球比賽中達到人類業餘選手等級的學習型機器人智能體。論文地址:https://arxiv.org/pdf/2408.03906DeepMind這個機器人打乒乓球什麼程度呢?大概和人類業餘選手不相上下:正手反手都會:對手採用多種打法,機器人也能招架得住:接不同旋轉的發球:不過,比賽激烈程度似乎不如公園老大爺對戰。對機器人來說,乒乓球運動

首配機械爪!元蘿蔔亮相2024世界機器人大會,發布首個走進家庭的西洋棋機器人 首配機械爪!元蘿蔔亮相2024世界機器人大會,發布首個走進家庭的西洋棋機器人 Aug 21, 2024 pm 07:33 PM

8月21日,2024世界機器人大會在北京隆重召開。商湯科技旗下家用機器人品牌「元蘿蔔SenseRobot」家族全系產品集體亮相,並最新發布元蘿蔔AI下棋機器人-國際象棋專業版(以下簡稱「元蘿蔔國象機器人」),成為全球首個走進家庭的西洋棋機器人。作為元蘿蔔的第三款下棋機器人產品,全新的國象機器人在AI和工程機械方面進行了大量專項技術升級和創新,首次在家用機器人上實現了透過機械爪拾取立體棋子,並進行人機對弈、人人對弈、記譜複盤等功能,

Claude也變懶了!網友:學會給自己放假了 Claude也變懶了!網友:學會給自己放假了 Sep 02, 2024 pm 01:56 PM

開學將至,該收心的不只即將開啟新學期的同學,可能還有AI大模型。前段時間,Reddit擠滿了吐槽Claude越來越懶的網友。 「它的水平下降了很多,經常停頓,甚至輸出也變得很短。在發布的第一周,它可以一次性翻譯整整4頁文稿,現在連半頁都輸出不了!」https:// www.reddit.com/r/ClaudeAI/comments/1by8rw8/something_just_feels_wrong_with_claude_in_the/在一個名為“對Claude徹底失望了的帖子裡”,滿滿地

世界機器人大會上,這家承載「未來養老希望」的國產機器人被包圍了 世界機器人大會上,這家承載「未來養老希望」的國產機器人被包圍了 Aug 22, 2024 pm 10:35 PM

在北京舉行的世界機器人大會上,人形機器人的展示成為了現場絕對的焦點,在星塵智能的展台上,由於AI機器人助理S1在一個展區上演揚琴、武術、書法三台大戲,能文能武,吸引了大量專業觀眾和媒體的駐足。在有彈性的琴弦上優雅的演奏,讓S1展現出速度、力度、精準度兼具的精細操作與絕對掌控。央視新聞對「書法」背後的模仿學習和智慧控制進行了專題報道,公司創始人來傑解釋到,絲滑動作的背後,是硬體側追求最好力控和最仿人身體指標(速度、負載等),而是在AI側則採集人的真實動作數據,讓機器人遇強則強,快速學習進化。而敏捷

ACL 2024獎項發表:華科大破解甲骨文最佳論文之一、GloVe時間檢驗獎 ACL 2024獎項發表:華科大破解甲骨文最佳論文之一、GloVe時間檢驗獎 Aug 15, 2024 pm 04:37 PM

本屆ACL大會,投稿者「收穫滿滿」。為期六天的ACL2024正在泰國曼谷舉辦。 ACL是計算語言學和自然語言處理領域的頂級國際會議,由國際計算語言學協會組織,每年舉辦一次。一直以來,ACL在NLP領域的學術影響力都名列第一,它也是CCF-A類推薦會議。今年的ACL大會已是第62屆,接收了400餘篇NLP領域的前沿工作。昨天下午,大會公佈了最佳論文等獎項。此次,最佳論文獎7篇(兩篇未公開)、最佳主題論文獎1篇、傑出論文獎35篇。大會也評出了資源論文獎(ResourceAward)3篇、社會影響力獎(

李飛飛團隊提出ReKep,讓機器人具備空間智能,還能整合GPT-4o 李飛飛團隊提出ReKep,讓機器人具備空間智能,還能整合GPT-4o Sep 03, 2024 pm 05:18 PM

視覺與機器人學習的深度融合。當兩隻機器手絲滑地互相合作疊衣服、倒茶、將鞋子打包時,加上最近老上頭條的1X人形機器人NEO,你可能會產生一種感覺:我們似乎開始進入機器人時代了。事實上,這些絲滑動作正是先進機器人技術+精妙框架設計+多模態大模型的產物。我們知道,有用的機器人往往需要與環境進行複雜精妙的交互,而環境則可被表示成空間域和時間域上的限制。舉個例子,如果要讓機器人倒茶,那麼機器人首先需要抓住茶壺手柄並使之保持直立,不潑灑出茶水,然後平穩移動,一直到讓壺口與杯口對齊,之後以一定角度傾斜茶壺。這

鴻蒙智行享界S9全場景新品發表會,多款重磅新品齊發 鴻蒙智行享界S9全場景新品發表會,多款重磅新品齊發 Aug 08, 2024 am 07:02 AM

今天下午,鸿蒙智行正式迎来了新品牌与新车。8月6日,华为举行鸿蒙智行享界S9及华为全场景新品发布会,带来了全景智慧旗舰轿车享界S9、问界新M7Pro和华为novaFlip、MatePadPro12.2英寸、全新MatePadAir、华为毕昇激光打印机X1系列、FreeBuds6i、WATCHFIT3和智慧屏S5Pro等多款全场景智慧新品,从智慧出行、智慧办公到智能穿戴,华为全场景智慧生态持续构建,为消费者带来万物互联的智慧体验。鸿蒙智行:深度赋能,推动智能汽车产业升级华为联合中国汽车产业伙伴,为

分散式人工智慧盛會DAI 2024徵稿:Agent Day,強化學習之父Richard Sutton將出席!顏水成、Sergey Levine以及DeepMind科學家將做主旨報告 分散式人工智慧盛會DAI 2024徵稿:Agent Day,強化學習之父Richard Sutton將出席!顏水成、Sergey Levine以及DeepMind科學家將做主旨報告 Aug 22, 2024 pm 08:02 PM

會議簡介隨著科技的快速發展,人工智慧成為了推動社會進步的重要力量。在這個時代,我們有幸見證並參與分散式人工智慧(DistributedArtificialIntelligence,DAI)的創新與應用。分散式人工智慧是人工智慧領域的重要分支,這幾年引起了越來越多的關注。基於大型語言模型(LLM)的智能體(Agent)異軍突起,透過結合大模型的強大語言理解和生成能力,展現了在自然語言互動、知識推理、任務規劃等方面的巨大潛力。 AIAgent正在接棒大語言模型,成為目前AI圈的熱門話題。 Au

See all articles