瀾舟堅持四、兩撥千斤:ToB 場景落地,10B 參數大模型足礬

王林
發布: 2024-03-21 12:21:40
轉載
848 人瀏覽過

專注、極致、口碑、快、成本。

周明是瀾舟科技創始人兼CEO,提出了“大模型落地九字法則”,這是在雷軍的互聯網“七字訣”基礎上,加入了“成本”一詞而形成的。

 澜舟坚持四两拨千斤:ToB 场景落地,10B 参数大模型足矣

他將 2024 年稱為大模型落地元年,但同時堅定地表示,這並不意味著遍地是黃金。

而大模型的具體落地姿態,周明用自己帶領的大模型創業團隊瀾舟科技身先士卒地做了個表率——利用瀾舟" 一橫N 縱" 體系,以孟子大模型為基礎,面向場景,發布產品。

簡單來說,就是抓技術和應用的雙輪驅動,在積極研究和掌握尖端技術的同時,致力於確保這些技術的有效應用。

3 月 18 日的瀾舟大模型技術與產品發表會現場,瀾舟科技也與零一萬物進行了策略合作簽約。

 澜舟坚持四两拨千斤:ToB 场景落地,10B 参数大模型足矣

現場,創新工場董事長、零一萬物CEO 李開復分享,目前世界上最好的大模型智慧已經達到人類平均智力水準的3 倍,也是說,100 題一般人只能答對33 道,而最好的AI 大模型可以答對99 道以上。

他展望了AI 2.0 時代未來的四大趨勢:

最革命性的AI 2.0 應用應該是AI-First / AI-Native:最終脫穎而出的應用,屬於那些敢於全力投入新科技的先驅者。大語言模型的引入為 AI-First 應用帶來了巨大的推動力。

大模型始於文本,未來將拓展至 " 全模態 ":跨模態生成技術是實現認知和決策智能的轉捩點。現實世界的訊息是文字、音訊、視覺、感測器以及人類各種觸覺的綜合體系,要更為精準地模擬現實世界,就需要將各種模態能力打通,例如文字- 影像、文字- 視訊等跨模態甚至全模態的綜合能力。

AI 2.0 將超越對話,從聊天工具到智慧生產力工具:使用者體驗以及未來互動介面和商業模式都會發生大的變革。

AI 2.0 將走向實體,大幅提振社會生產力:具身智慧可以讓機器人製造機器人,進一步實現 AI 2.0 生產線智慧規劃。

專注研發 10B-100B 參數大模型

瀾舟科技成立於 2021 年 6 月,是國內最早一批下場,進行大模型創業的團隊。

去年3 月,瀾舟發布了孟子GPT V1(MChat);今年1 月,孟子大模型GPT V2(含孟子大模型- 標準、孟子大模型- 輕量級、孟子大模型- 金融、孟子大模型- 編碼)對外開放。

近期,瀾舟團隊完成了Mengzi3-13B的大模型訓練。

 澜舟坚持四两拨千斤:ToB 场景落地,10B 参数大模型足矣

多說一句,孟子大模型訓練背後有個大功臣,即總規模3T tokens 的Mengzi-3 資料集,包含了網頁、程式碼、書籍、論文等高品質資料來源。

據介紹,本月底(3 月 30 日),Mengzi3-13B 的模型將在 GitHub、HuggingFace、魔搭和始智 AI 社群中開源。

為什麼開源的孟子大模型,是 13B 版本的?周明正面回答了這個問題。

首先,瀾舟明確以服務 ToB 場景為主,ToC 為輔。

實務發現,ToB 情境使用頻率最高的大模型參數量多為 7B、13B、40B、100B,整體集中在 10B-100B 之間。

其次,在這個區間範圍內,從 ROI 角度來講,既滿足場景需求,又最具性價比。

所以很長一段時間內,瀾舟的目標都是做好 10B-100B 參數規模範圍內的產業大模型。這就不能理解為什麼開源版本會選擇 13B。

周明解釋道,他自己其實也是 Scaling law 的信仰者,但創業不同於科學研究。

" 第一,這個大小的大模型已經可以解決80% 的問題;第二,對團隊來說也比較穩定,不會因為不斷擴大的模型規模競賽而感到焦躁不安。" 周明補充說,這樣冷靜的思考,可以確保良好的成本控制,避免無謂的GPU 算力、數據、人力投入競賽。

 澜舟坚持四两拨千斤:ToB 场景落地,10B 参数大模型足矣

" 一橫 N 縱 " 體系

發表會上,瀾舟公佈了自己的一橫 N 縱體系。

" 一橫" 是模型層,是孟子大模型技術基礎上研發的各個模型;

"N 縱" 則是基於孟子大模型的面向ToB 應用最重要的技術和產品。

據了解,瀾舟目前重點投入了金融業,輔助程式設計等領域,旨在透過更全面、專業、優質的領域數據,打造更貼近產業場景的垂直大模型。

 澜舟坚持四两拨千斤:ToB 场景落地,10B 参数大模型足矣

以孟子GPT 通用大模型的" 一橫" 為基礎,瀾舟科技合夥人、首席產品官李京梅,介紹了瀾舟的應用能力型產品,包括:

AI 文件理解:涵蓋專業的PDF 文件解析能力和資訊擷取能力,為RAG 方案中的文件理解提供了更優的基礎能力;

AI 文件問答:根據企業需要,提供私有化企業智慧知識庫建構的解決方案能力;

AI 文件輔助寫作:支援使用者上傳多個文件作為參考資料,支援自訂多層題目和寫作提綱,由大模型賦能自動化依要求產生完整的文章初稿;

機器翻譯平台:專注以中文為中心的世界主要語種之間互譯和20 幾個領域的專業翻譯;

瀾舟智會:專注會議內容的智慧分析與問答的產品, 是基於大模型打造的大模型原生的智慧會議助理;

瀾舟AI 搜尋:大語言模型時代的搜尋引擎。

 澜舟坚持四两拨千斤:ToB 场景落地,10B 参数大模型足矣

過去一年,大模型領域日新月異。

OpenAI 在做什麼我們就去做什麼,短期可以,長期不可取,一定要有自己的創新思路。

如何揚長避短,走出自己的獨特的創新之路,周明表達了自己的看法。

最關鍵的第一步,就是企業要有明確定位。瀾舟科技的定位就和國內其它大模型新創公司有明顯差異。

他舉例,瀾舟的定位就是作" 大模型技術企業場景應用" 的綜合公司," 我們希望能做到站在技術角度最懂應用,站在應用角度最懂技術,同時又希望把科技和應用形成一種生態連結在一起,讓兩邊可以快速迭代。」

同時,依然需要聚焦和抓緊落地-透過落地,創造價值,拉動創新。

而且要注意,創新和落地是相輔相成的。

不要一味的創新或一味的落地,要把這兩者連結在一起,讓它快速的迭代。

最後周明還語重心長地提醒:

今年是大模型落地元年,就遍地是黃金是嗎?不是的,我可以負責任地說,很多地方我們都沒有開拓。

例如大模型如何解決落地的最後一公里?大模型的商業模式是什麼?如何加強交付能力?如何提高產品的商業化?

大模型落地的一切,其實才剛開始。

— 聯絡作者 —

#

以上是瀾舟堅持四、兩撥千斤:ToB 場景落地,10B 參數大模型足礬的詳細內容。更多資訊請關注PHP中文網其他相關文章!

來源:myzaker.com
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板
關於我們 免責聲明 Sitemap
PHP中文網:公益線上PHP培訓,幫助PHP學習者快速成長!