訊飛星火V3.5正式發布,基於全國產算力平台「飛星一號」訓練

WBOY
發布: 2024-04-10 14:49:01
轉載
987 人瀏覽過

科大訊飛將在1月30日舉行星火認知大模型V3.5升級發表會。科大訊飛董事長劉慶峰、研究院院長劉聰正式發表以首個全國產算力訓練為基礎的訊飛星火V3.5。

科大訊飛宣佈於2023年10月24日,發布首個支撐萬億參數大模型訓練的萬卡國產計算力平台“飛星一號”,正式啟用。啟用後的90多天裡,訊飛星火基於“飛星一號”,啟動了對標GPT-4的更大參數規模的大模型訓練,帶來了1月30日這場訊飛星火V3. 5升級發布。

基於全民開放大模型訓練的全民開放大模型火V3.5在語言理解、文本生成、知識問答、邏輯推理、數學能力、代碼能力和多模態能力七個方面取得了全面升級。其中語言理解、數學能力超過GPT-4 Turbo,程式碼達到GPT-4 Turbo 96%,多模態理解達到GPT-4V 91%。

目前,訊飛星火已賦能保險、銀行、能源、汽車、通訊等領域聯合龍頭企業,透過與太平洋保險合作,透過星火太平洋保險合作,透過星火太平洋計畫賦能內部知識服務、辦公室、審計、展業等,打造數位勞動力在保險領域的應用標竿;聯合交通銀行,賦能客服、展業、辦公、研發等,重點打造銀行領域的代碼能力應用標竿;與國家能源集團聯合,賦能煤炭、電力、運輸、化工等方面,打造央企集團一體化連動的大模型應用標竿;與國家能源集團聯合,賦能煤炭、電力、運輸、化工等方面,打造央企集團一體化連動的大模型應用標竿。

除此之外,深度適配國產算力的「訊飛星火開源大模型」首次發布,場景應用效果領先,昇思開源社群聯合首發上線。

訊飛星火V3.5正式發布,基於全國產算力平台「飛星一號」訓練

這次開源擁有1.3億參數(13B),包含基礎模型iFlytekSpark-13B-base、精調模型iFlytekSpark-13B-chat,開源了微調工具iFlytekSpark- 13B-Lora、人設定製工具iFlytekSpark-13B-Charater。學術企業研究可基於全端自主可控的星火優化套件,更方便地訓練自己的專用大模型。

劉慶峰透露,星火開源大模型在技術上形成了差異化優勢。星火開源-13B在多項知名公開評測任務中名列前茅,在文本生成、語言理解、文本改寫、行業問答、機器翻譯等企業典型場景中,透過對學習輔助、語言理解等領域的深入研究和優化,實現了效能大幅提升,在處理複雜的自然語言任務時更加得心應手。

基於「飛星一號」訓練,星火開源大模型全端國產適配優化,簡單易用,場景應用效果領先,訓練策略針對昇騰算力極致優化,訓練效率達A100的90%。這不僅是昇騰AI硬體的進一步深度優化,也展示了國產算力在追趕國際先進水平方面的決心和能力。

開源只有更多的場景落地,才能更好地增進生態合作。目前,華為昇思開源社群已正式上架星火大模型開源版-13B,面對學術、企業研究完全免費,增進學術合作的同時,增進產業探索。

展望2024年訊飛星火大模型發展,劉慶峰指出三點:「首先,一定要在通用大模型的底層能力上持續對標國際最先進水平,從演算法研究包括更小的算力上做出相對更優效果。」我們要清醒理智看到差距,目前在小樣本快速訓練、多模態深度學習訓練、超複雜深度理解等領域距離GPT-4的最好水準還有差距,訊飛星火有信心在今年上半年趕上GPT-4目前最佳水準。 「今天的通用大模型不一定代表人工智慧的全部未來,還有很多創新要做,如腦科學互動、對抗網路的深度連結等需要整個創新的生態,但我們一定要有勇氣、有期許走在最前面。」劉慶峰指出。

「第二,2024年要真正讓大模型量質齊飛,不僅是產業應用,還要在許多關鍵技術創新上聯動大模型,中國企業界、科學界有信心實現超越。 」

「第三,高樓大廈要建立在安全可控的平台之上,我們要實現自主可控平台上的生態繁榮。」劉慶峰表示,自己有信心,能夠實現從演算法、數據、應用場景到算力,建構一個完全自主可控的繁榮的人工智慧生態。

以上是訊飛星火V3.5正式發布,基於全國產算力平台「飛星一號」訓練的詳細內容。更多資訊請關注PHP中文網其他相關文章!

相關標籤:
來源:jiqizhixin.com
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板