智譜AI推出第三代基座大模型ChatGLM3,以適應更多國產晶片
2023年10月27日的消息是,智譜AI在中國電腦大會(CNCC)上發布了全新自研的第三代基座大模型ChatGLM3和相關係列產品。這次發布標誌著智譜AI在推出千億基座對話模型ChatGLM和ChatGLM2之後取得了重大突破
ChatGLM3是採用了獨創的多階段增強預訓練方法開發的。這種方法能夠使得訓練更加充分。根據評測結果顯示,在44個中英文公開資料集測試中,ChatGLM3在國內同尺寸模型中排名第一。智譜AI的CEO張鵬在發布會上進行了新品發布,並實時演示了最新上線的產品功能
ChatGLM3全新技術升級 更高效能更低成本
#智譜AI推出的ChatGLM3經過更豐富的訓練資料和更優的訓練方案,表現更加強大。與ChatGLM2相比,MMLU提升了36%、CEval提升了33%、GSM8K提升了179%、BBH提升了126%
同時,ChatGLM3瞄準向GPT-4V本次實現了若干全新功能的迭代升級,包括多模態理解能力的CogVLM-看圖識語義,在10餘個國際標準圖文評測資料集上取得SOTA ;程式碼增強模組Code Interpreter依使用者需求產生程式碼並執行,自動完成資料分析、檔案處理等複雜任務;網路搜尋增強WebGLM-存取搜尋增強,能自動依問題在網路上尋找相關資料並在回答時提供參考相關文獻或文章連結。 ChatGLM3的語意能力與邏輯能力得到了極大的增強。
ChatGLM3也整合了自研的AgentTuning技術,啟動了模型智能體能力,尤其在智慧規劃與執行方面,相較於ChatGLM2提升了1000% ;開啟了國產大模型原生支援工具呼叫、程式碼執行、遊戲、資料庫操作、知識圖譜搜尋與推理、作業系統等複雜場景。
此外,ChatGLM3本次推出可手機部署的端測模型ChatGLM3-1.5B和ChatGLM3-3B,支援包括vivo、小米、三星在內的多款手機以及車載平台,甚至支援行動平台上CPU晶片的推理,速度可達20 tokens/s。精度方面1.5B和3B模型在公開benchmark上與ChatGLM2-6B模型性能接近。
基於最新的高效動態推理和顯存優化技術,ChatGLM3目前的推理框架在相同硬體、模型條件下,相較於目前最佳的開源實現,包括伯克利大學推出的vLLM 以及Hugging Face TGI的最新版本,推理速度提升了2-3倍,推理成本降低一倍,每千tokens僅0.5分,成本最低。
本內容僅供參考,不構成任何投資建議。讀者在使用這些資訊時應自行判斷,並為自己的決策負責。本網站不對任何因使用本內容而導致的損失負責
本號不對發佈的任何資訊的可用性、準確性、時效性、有效性或完整性作出聲明或保證,並在此聲明不承擔資訊可能產生的任何責任、任何後果。 重寫後: 本帳號對所發佈的任何資訊的可用性、準確性、時效性、有效性或完整性不作任何聲明或保證,並且在此聲明中不承擔任何責任或後果
2、 本號非商業、非營利性,轉載的內容並不代表贊同其觀點和對其真實性負責,也無意構成任何其他引導。本號不對轉載或發布的任何資訊存在的不準確或錯誤,負任何直接或間接責任。
3、本文所使用的資料、素材、文字、圖片等皆來自互聯網,所有轉載內容都已標示出處。如果您發現有侵犯您的智慧財產權或個人合法權益的作品,請與我們聯繫,我們將及時進行修改或刪除
以上是智譜AI推出第三代基座大模型ChatGLM3,以適應更多國產晶片的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

在從事代理AI時,開發人員經常發現自己在速度,靈活性和資源效率之間進行權衡。我一直在探索代理AI框架,並遇到了Agno(以前是Phi-

該版本包括三種不同的型號,GPT-4.1,GPT-4.1 MINI和GPT-4.1 NANO,標誌著向大語言模型景觀內的特定任務優化邁進。這些模型並未立即替換諸如

SQL的Alter表語句:動態地將列添加到數據庫 在數據管理中,SQL的適應性至關重要。 需要即時調整數據庫結構嗎? Alter表語句是您的解決方案。本指南的詳細信息添加了Colu

解鎖嵌入模型的力量:深入研究安德魯·NG的新課程 想像一個未來,機器可以完全準確地理解和回答您的問題。 這不是科幻小說;多虧了AI的進步,它已成為R

模擬火箭發射的火箭發射:綜合指南 本文指導您使用強大的Python庫Rocketpy模擬高功率火箭發射。 我們將介紹從定義火箭組件到分析模擬的所有內容

雙子座是Google AI策略的基礎 雙子座是Google AI代理策略的基石,它利用其先進的多模式功能來處理和生成跨文本,圖像,音頻,視頻和代碼的響應。由DeepM開發

“超級樂於宣布,我們正在購買花粉機器人,以將開源機器人帶到世界上,” Hugging Face在X上說:“自從Remi Cadene從Tesla加入我們以來,我們已成為開放機器人的最廣泛使用的軟件平台。

在AI社區的重大發展中,Agentica和AI共同發布了一個名為DeepCoder-14B的開源AI編碼模型。與OpenAI等封閉源競爭對手提供代碼生成功能
