AI大模型駛向產業之海，需要高數據「河道」引航-人工智慧-PHP中文網

首頁

科技週邊

人工智慧

AI大模型駛向產業之海，需要高數據「河道」引航

PHPz

Dec 02, 2023 am 08:45 AM

數據導航產業佈局模型驅動

在某次產業高峰會上，一位來自清華大學的院士科學家透露，我們的AI大模型是在萬卡集群上進行訓練的，每三小時就會出現一次錯誤。雖然聽起來有點可笑，但這已經達到了世界先進水平

風靡全球的AI大模型，是今年毋庸置疑的風口，數量不斷增長，達到了驚人的水平。「百舸爭流」之下，大家卻常常會忽略一個關鍵問題：AI大模型帶來的資料激流，也比想像中更加洶湧。

“三小時出錯一次”，聽起來不可思議的故障率，卻是大模型從業者要面對的常態，甚至是“優等生”。目前業界的普遍做法，是寫容錯檢查點checkpoint。既然三小時就報錯，那就2.5小時停一次，寫好檢查點，把資料存起來，再開始訓練。一旦故障，可以從寫好的檢查點恢復，避免「從頭開始」、全部白乾。而檢查點需要儲存的資料多，會耗費大量的時間。該院士團隊基於llama 2架構研發的大模型，資料存一次硬件，就需要十個小時，儲存效率直接影響了開發進度。

如果說大規模的異質數據，是肆意奔湧的激流，儲存系統就是承載著數據流量的河道，其寬闊堅固程度直接決定了數據是否會淤塞甚至停滯，從而卡住AI大模型的生命線。可以說，整個大模型產業的生產力和效率，都被儲存規定了「上限」。

這也是為什麼，儲存作為AI資料基礎設施，受到越來越多關注。

AI大模型駛向產業之海，需要高數據「河道」引航

11月29日，「數智創新 AI未來」2023中國數據與儲存高峰會在北京舉辦。曙光儲存發布了以AI大模型為導向的儲存解決方案。

藉此機會，我們一起了解一下，AI大模型浪潮來襲，給存儲帶來的承載挑戰，以及曙光存儲是如何為智能產業引航，助推AI大模型百舸揚帆。

AI大模型正在進入產業的深水區，傳統儲存方式面臨著數據的挑戰

#最近我去了一趟雲南，發現不僅北上廣等科技重地的大模型建設如火如荼，在昆明、大理等二三線城市，甚至邊疆地區，都在積極地探索大模型行業應用。

各行各業走向智慧化，幾乎都點燃了對大模型的熾熱興趣。這時候，一個關鍵問題也顯露了出來：AI大模型的產業化風潮，需要升級儲存基礎架構。

模型開發者的每一次訓練，資料都在向儲存系統發起多種挑戰：

資料洪潮的衝擊。 隨著大模型的產業落地，許多行業都開始訓練專屬模型，大量行業數據、專有數據、新的標註數據被輸送給大模型，澎湃的數據數量對存儲系統提出了挑戰。雲南某資料科技公司提到，產業大模型要用高品質的資料集、文件、客戶私有資料訓練，每個專案都是單獨成立標註組，資料規模持續增大，儲存訴求和成本也隨之增加。

AI大模型駛向產業之海，需要高數據「河道」引航

2.資料淤塞的桎梏。 超大規模資料預處理的速度慢、耗時長，採集、歸類、搬遷等過程費時費力，一旦儲存效能跟不上，海量檔案吞吐慢、多讀少寫，檢查點Checkpoint等待耗時久，會延緩開發進度，增加開發成本。

3.資料複雜的暗湧。 此外，AI大模型要用到大量異質數據，文件格式複雜、數據集類型多樣，數據數量激增，傳統存儲難以應對數據複雜性的挑戰，容易產生消化不良的問題，造成數據訪問效率低，因而造成模型運作效率下降，訓練算力消耗增多，無法充分「壓榨」昂貴的GPU算力資源。例如雲南當地的太陽觀測站，透過讓AI科學運算模型學習海量圖片，呈現太陽真實的樣子，每天產生2TB的圖片數據，目前儲存的吞吐效率低，會導致訓練集載入慢、數據處理週期長，拖慢研究進程。

4. 資料安全的隱憂。 目前，AI大模型已經深度滲透各行業之中，在訓練開發及應用落地過程中需要海量的數據支撐，其中包含行業或個人敏感信息的數據，如果沒有合理的數據脫敏和數據託管機制，則可能造成資料洩露，對行業和個人造成損失。同時，模型安全風險也需重視，例如，外掛程式可能被植入有害內容，成為不法分子詐欺和「投毒」的工具，危及社會和產業安全。

AI大模型駛向產業之海，需要高數據「河道」引航

AI大模型駛向產業深水區，令人欣喜的是，這項技術創新正在深度融入各行各業，滿足智慧化需求，生機勃勃。然而，也存在一些擔憂，資料工程在大模型的整個生命週期中起著重要作用，包括資料收集、清理、訓練、推理部署和回饋調優等各個階段，都需要大量的資料。然而，儲存問題成為一個瓶頸，這意味著AI大模型在各個階段都可能面臨資料堵塞、故障和效率低下的情況，這將導致大模型的開發週期和綜合成本非常高，超出產業的承受能力

為了避免資料淤塞，支持和培養大型模式的產業發展，我們需要對儲存「河道」進行疏浚。曙光儲存提供了一種新的解決方案，這為我們發現了有價值的參考案例

高品質資料“航道”，曙光儲存給大模型產業一個答案

經過與AI大模型開發者的交流，我得出了一個明確的結論：建立一個適配AI大模型的全新儲存體系，已經不再需要討論，關鍵是誰能先完成方案升級、提供實用的解決方案

洞察產業的存力需求，曙光儲存打造了以ParaStor大模型專用儲存為底座的AI大模型儲存解決方案，寫下了自己的答案。

AI大模型駛向產業之海，需要高數據「河道」引航