首頁 > 科技週邊 > 人工智慧 > 545%! DeepSeek首披露成本利潤率 專家:若在美國已是一家價值逾百億美元公司

545%! DeepSeek首披露成本利潤率 專家:若在美國已是一家價值逾百億美元公司

php.cn
發布: 2025-03-12 13:30:02
原創
833 人瀏覽過

中國AI新創公司DeepSeek近來「開源」一波波,上週六(1日) 又有更大驚喜,全面揭秘DeepSeek-V3/R1推理系統,不僅公開其推理系統的核心優化方案,更首次披露成本獲利率等關鍵數據,引發產業震動。

DeepSeek上週六在知乎平台發布首條文章,公佈模型推理成本利潤細節,並披露成本獲利率關鍵資訊,若所有tokens全按DeepSeek-R1的定價計算,理論上一天的總收入為56萬2027美元,成本獲利率為545%,這一數字刷新全球AI大模型領域的獲利天花板。

根據DeepSeek官方披露,DeepSeek V3和R1的所有服務均使用H800 GPU,使用和訓練一致的精度,即矩陣計算和dispatch傳輸採用和訓練一致的FP8格式,core-attention計算和combine傳輸採用和訓練一致的BF16,最大程度保證了服務效果。

在最近24小時(2025年2月27日12:00至28日12:00) 的統計週期,若GPU租賃成本按2美元/ 小時計算,日均成本為8萬7072美元,而若所有輸入/ 輸出token按R1定價(輸入1元/ 百萬token、輸出16元/ 百萬token) 計算,單日收入可達56萬2027美元(約1865萬新台幣),成本獲利率高達545%。

MenloVentures投資人Deedy在看完上述數據後指出,獲利率超過500%這一商業效率在美國將是一家價值逾百億美元的公司。

中國矽基流動創辦人袁進輝也在第一時間發表了自己的感受說:「DeepSeek官方披露大規模部署成本和收益,又一次顛覆了很多人認知。」

DeepSeek的高獲利率源於其創新的推理系統設計,核心包括大規模跨節點專家並行(EP)、計算通信重疊與負載均衡優化三大技術支柱。 EP提升吞吐與回應速度,針對模型稀疏性(每層僅啟動8/256個專家),採用EP 策略擴展總體批處理規模,確保每個專家獲得足夠的計算負載,顯著提升GPU利用率,部署單元動態調整(如Prefill階段4節點、Decode階段18 節點),平衡資源分配與任務需求。

簡言之,EP就像是「多人協作」,把模型中的「專家」分散到多張GPU上進行計算,大幅提升Batch Size,榨乾GPU算力,同時專家分散,降低存儲器壓力,更快回應。

DeepSeek在工程層面進一步壓縮成本,加上晝夜資源調配,白天高峰時段全力支援推理服務,夜間閒置節點轉用於研發訓練,最大化硬件利用率,緩存命中率達56.3%,通過KVCache硬盤緩存減少重複計算,在輸入token中,有3420億個(56.3%)直接命中緩存,大幅降低算力消耗。

有分析稱DeepSeek此次披露的數據,不僅驗證其技術路線的商業可行性,更為行業樹立高效獲利標竿,模型訓練成本僅為同類產品的1%至5%,此前發布的DeepSeek-V3模型訓練成本僅557.6萬美元,遠低於OpenAI等巨頭。在推理定價優勢方面,DeepSeek-R1的API定價僅為OpenAI o3-mini的七分之一到一半左右,低成本策略加速市場滲透。

還有分析指出,DeepSeek此次「透明化」披露不僅展示其技術實力與商業潛力,更向行業傳遞明確信號,也就是AI大模型的獲利循環已從理想照進現實,代表AI技術從實驗室邁向產業化的關鍵轉折。

不過,DeepSeek官方坦言實際上沒有這麼多收入,因V3定價更低,同時收費服務只佔了一部分,另外夜間還會有折扣。

中信證券認為,Deepseek在模型訓練成本降低方面的最佳實踐,料將刺激科技巨頭採用更經濟方式加速前沿模型的探索和研究,同時將使得大量AI應用得以解鎖和落地。演算法訓練帶來的規模報酬遞增效應,以及單位算力成本降低對應的傑文斯悖論等,均代表中短期維度科技巨頭繼續在AI算力領域進行持續、規模投入仍將是高確定性事件。

以上是545%! DeepSeek首披露成本利潤率 專家:若在美國已是一家價值逾百億美元公司的詳細內容。更多資訊請關注PHP中文網其他相關文章!

相關標籤:
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板