效果可達 OpanAI 同等模型 96%,國產開源 AI 語言模型 TigerBot 發布

WBOY
發布: 2023-06-10 13:35:10
轉載
1095 人瀏覽過

6 月 8 日消息,國產多模態大語言模式 TigerBot 近日正式發布,包含 70 億參數和 1,800 億參數兩個版本,目前已經在 GitHub 開源。

效果可达 OpanAI 同等模型 96%,国产开源 AI 语言模型 TigerBot 发布

▲ 圖源TigerBot 的GitHub 頁面

據悉,TigerBot 帶來的創新主要在於:

    ##提出指令完成監督微調的創新演算法提升模型可學習性。
  • 運用 ensemble 和 probabilistic modeling 的方法來實現可控事實性和創造性。
  • 在平行訓練上突破 deep-speed 等主流框架中的記憶體和通訊問題。
此外,模型也針對中文語言更不規則的分佈,從 tokenizer 到訓練演算法上做了更適合的最佳化。

研究人員陳燁在虎博科技官網表示:「該模型在只使用少量參數的情況下,就能快速理解人類提出了哪類問題。根據OpenAI InstructGPT 論文在公開NLP 資料集上的自動評測,TigerBot-7B 已達到OpenAI 同樣大小模型的綜合表現的96%。」

效果可达 OpanAI 同等模型 96%,国产开源 AI 语言模型 TigerBot 发布##▲ 圖源TigerBot 的GitHub 頁面

據稱,其中TigerBot-7B-base 的表現「優於OpenAI 同等可比較模型」 ,開源程式碼包括基本訓練和推理程式碼,雙卡推理180B 模型的量化和推理程式碼。數據包括 100G 預訓練數據,監督微調 1G 或 100 萬條數據。

IT之家小夥伴可以

在這裡找到 GitHub 的開源專案

以上是效果可達 OpanAI 同等模型 96%,國產開源 AI 語言模型 TigerBot 發布的詳細內容。更多資訊請關注PHP中文網其他相關文章!

相關標籤:
來源:51cto.com
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板