近日,以「AI引領時代,算力驅動未來」為主題的「臨港新片區智算大會」舉行。會上,新片區智算產業聯盟正式成立,商湯科技作為算力提供企業成為聯盟一員,同時商湯科技被授予「新片區智算產業鏈鍊主」企業。
作為臨港算力生態的積極參與者,商湯目前已建立了亞洲目前最大的智慧運算平台之一-商湯AIDC,可以輸出5000 Petaflops的總算力,可支援20個千億參數量的超大模型同時訓練。以AIDC為底座、前瞻打造的商湯大裝置SenseCore,致力於打造高效率、低成本、規模化的下一代AI 基礎設施與服務,賦能人工智慧生產新範式,將成為AGI時代的基礎設施服務領導者。
AI大模型浪潮下,算力需求爆增
#人工智慧三大要素主要包括數據、演算法以及算力。根據OpenAI近日發布的數據,自2012年以來人工智慧訓練任務中使用的算力呈指數級增長,其增長速度為每3.5個月翻一倍。截止目前人們對算力的需求已增加了超過30萬倍,ChatGPT的熱門引發了市場對算力的新需求。
目前我國算力市場維持持續成長,經信通院測算,2021年我國運算設備算力總規模達202 EFlops,成長率約50%,高於全球成長速度。
在此背景下,上海臨港積極發揮本地算力產業優勢和生態牽引作用,發布了《臨港新片區加快構建算力產業生態行動方案》(以下簡稱《方案》)。
據介紹,臨港新片區算力產業已在上游軟硬體、中游的資料中心、調度平台、下游應用都進行了相應佈局,目前臨港總算力超過3EFLOPS(FP32),智能算力佔比近80%,總算力規模約佔上海市近20%。
《方案》提出,目標到2025年,臨港新片區將形成以智算算力為主、基礎算力和超算算力協同的多元算力供給體系,總算力超過5EFLOPS(FP32) ,AI算力佔比達80%,算力產業整體規模突破100億元,建成公共算力服務平台,規範算力交易機制,實現區域算力調度,打造具有全國影響力的算力產業集聚區,建造一批算力示範應用標竿場景。
商湯科技董事長兼CEO徐立表示,算力是新時代的能源,某種程度上,算力決定了市場的競爭力。 「算力是整個模型能力的表達,等於演算法或說大模型的參數去乘上它所處理的資料量。大模型時代參數越大,乘上的資料量越大,所需要的算力就越大。」
同時,臨港新片區智算產業聯盟正式成立,該產業聯盟成員代表由25家企業和3所高校與科研院所共同組成,後續將開展資源共享、技術交流和項目合作,推動新片區智算產業應用賦能經濟發展。
商湯科技被授予“新片區智算產業鏈鍊主”,位於臨港新片區的商湯科技智能計算中心承載著長三角開展大規模人工智能研發和產業化重任,後續將積極參與到臨港智算產業鏈的協同融合與集聚發展。
大模型 大算力融合創新
大模型和大算力的融合正在掀起生產範式的重大轉變,推動科學研究和產業應用邁向智慧運算驅動的通用人工智慧(AGI)時代。在技術快速迭代的發展初期階段,產業亟需建置新一代的基礎設施,降低應用門檻、縮短研發週期、提高創新效率。
商湯科技超前佈局,歷時五年,打造了商湯大裝置SenseCore,並在此基礎上構建了“商湯日日新SenseNova”大模型體系,為行業提供覆蓋大模型算法服務、訓練和推理優化以及數據服務等軟硬結合的AGI基礎設施。
據介紹,商湯大裝置SenseCore以商湯人工智慧計算中心(簡稱「商湯智算中心或商湯AIDC」)為算力基座,包含27,000塊GPU,可以輸出5000 Petaflops的總算力,擁有業界領先的算力輸出能力、超大模型訓練及大規模推理能力,是亞洲目前最大的智慧運算平台之一。
商湯大裝置SenseCore目前算力可支援20個千億參數量的超大模型同時訓練,並提供涵蓋資料、訓練工具、推理部署、效能優化一條龍的大模型基礎設施服務系統。
商湯大裝置擁有出色的並行運算能力,能夠以最大3200卡規模集群進行單任務訓練,並可做到七天以上不間斷的穩定訓練,不僅支持了商湯自身的大模型訓練項目,而且還訓練了其他企業自訂的模型。
此外,商湯大裝置融合了AI、超算與大數據的核心能力,透過為AI優化的高效能運算、高效能儲存及快取、高效能網絡,以存算分離,大規模彈性、容錯調度等特徵,支撐大模型在數千張卡片、PB級儲存上,完成兆級參數大模型訓練。
SenseCore AI平台產品也提供了模組化、全鏈條的資料、訓練及推理能力。可實現百億級資料管理及檢索,人工標註服務,加速AI大模型研發效率。一鍵量化、一鍵部署、一鍵應用,提供了大模型快速上線驗證的工具,加速創新。
此外,大裝置也為客戶及生態夥伴提供全鏈條MaaS大模型即服務,加速大模型的創新與應用效率。
其中,自動化資料標註服務可將智慧標註效率提升百倍;大模型推理部署服務可將大模型推理效率提高600%;大模型並行訓練服務支援單集群3200卡5000億稠密參數模型訓練;大模型增量訓練服務能夠將增量微調成本降低90%。
商湯AI大模型賦能多產業發展
#在大裝置的賦能下,商湯在大模型領域實現了快速發展。
根據徐立介紹,今年3月開源的「書生2.5」多模態大模型在偵測、分割、分類三大主流視覺任務下二十多個權威資料集上全面領先,這為自動駕駛、機器人等通用場景任務提供高效精準的感知和理解能力支援。
對於人工智慧基礎科學(AI For Science)而言,在氣象氣候預報任務中,全球中期天氣預報是最重要的預測任務之一。今年4月相的全球中期氣象預報AI大模式「風烏」首次實現在高解析度上對核心大氣變數進行超過10天的有效預報,且在80%的評估指標上超越GraphCast模式。由於採用高解析度全球大氣資料建模,「風烏」還可以模擬颱風等極端氣象,準確預測颱風軌跡。
商湯建構的業界首個感知決策一體化的端到端自動駕駛解決方案UniAD,在多項關鍵數據集與指標上超越了SOTA方法,使車道線的預測準確率提升了30%,預測運動位移的誤差降低了近40%,規劃誤差降低了近30%。
此外,商湯還在上個月推出的SenseEarth 3.0遙感大模型不僅擁有業界最全的解譯類別,且在解譯效率、泛化能力、解譯精度等眾多指標上均實現了技術突破。
徐立表示,「在AGI時代,模型的能力可以用算力來衡量。我們以商湯大裝置SenseCore打造AGI時代的基礎設施,在模型的迭代速度及處理問題的能力上日日更新,不斷解鎖AGI的更多可能。」
據悉,截至今年5月,商湯大裝置已累計服務超40個核心客戶,其中大模型客戶10家以上,涵蓋智慧駕駛、生物製藥、晶片設計、智慧商業、高校科研等前沿領域,並已在超過20個落地場景中實現大模型交付。
商湯科技聯合創辦人、大裝置事業群總裁楊帆表示,如今所看到的大模型的成績發展,是透過人工智慧三要素的持續規模上升帶來的技術價值的提升,同時也是這種基礎的研發能力和系統的工程化能力深度的完美結合。這三要素很多時候是聯合調優的,演算法的最佳化、資料的整理和選取以及算力的平台性,這三者間往往是互相連通的,很難把它們變成割裂的環節獨自去做。這就是為什麼要做智慧算力產業鏈,因為只有鏈上的更多企業,促進彼此的交流合作思考,更深度的進行合作,才能夠在新的關鍵性的重大技術浪潮中,做到更好的技術進步和支援。
以上是AI大模型浪潮下算力需求爆增,商湯「大模型+大算力」賦能多元產業發展的詳細內容。更多資訊請關注PHP中文網其他相關文章!