最近,一個被稱為「ChatGPT Plugins國產替代系統」的開源專案在GitHub上星標激增。
這個專案就是BMTools,面壁智慧自研的大模型工具學習引擎。
計畫網址:https://www.php.cn/link/a330f9fecc388ce67f87b09855480ca3
首先,是最重要的問題,BMTools到底厲害在哪裡?
作為基於語言模型的開源可擴展工具學習平台,面壁研發團隊將各種各樣的工具調用流程都統一到了BMTools框架上,使整個工具調用流程標準化、自動化。
目前,BMTools支援的插件,涵蓋娛樂,學術,生活等多方面,包括douban-film(豆瓣電影)、search(必應搜尋)、Klarna(購物)等。
開發者可以透過BMTools,使用給定的模型(例如ChatGPT、GPT-4)來呼叫多種多樣的工具接口,以實現特定功能。
此外,BMTools工具包也已整合最近爆火的Auto-GPT與BabyAGI。
#那麼,這種工具學習對大模型有何影響?
儘管大模型在許多方面取得了顯著的成果,但在特定領域的任務上,仍然存在一定的限制。這些任務往往需要專業化的工具或領域知識才能有效解決。
因此,就像智慧型手機需要下載App才有更好的使用體驗,大模型需要具備呼叫各種專業化工具的能力,這樣才能為現實世界任務提供更為全面的支援。
大模型新典範工具學習(Tool Learning)你應該運而生。這個範式的核心在於將專業工具與基礎模型的優勢相融合,以在問題解決方面達到更高的準確性、效率和自主性。
大模型與外部工具的有機結合成功彌補了先前能力的諸多短板,工具學習極大地釋放了大模型的潛力。
論文網址:https://arxiv.org/abs/2304.08354
#2023年3月23日,OpenAI宣布推出外掛系統(Plugins),這個外掛的能力就是我們所說的工具學習。
在工具學習的加持下,Plugins能夠支援ChatGPT連線瀏覽器、數學運算等外部工具,能力大幅增強。
ChatGPT Plugins的出現補充了ChatGPT最後的短板,使其可以支援連網、解決數學計算,被稱為OpenAI的「App Store」時刻。然而直到現在,它僅支援OpenAI Plus用戶,大多數開發者仍然無法使用。
面壁為什麼能在ChatGPT Plugins發布後僅十天就推出BMTools?
面壁智慧一直潛心研發大模型全流程高效運算工具,研發團隊從2022年就開始持續進行工具學習新典範的研究,嘗試將現有語言模型與搜尋引擎、知識庫等工具結合,取得了較好的實驗效果。團隊也在工具學習前沿研究領域進行了卓有成效的探索。
為滿足眾多開發者對OpenAI Plugins能力的熱切期盼,在前期積累的基礎上,團隊快速將相關研究成果工具化,積累整理成工具包BMTools,將工具學習嵌入面壁智慧大模型能力體系,正式加入OpenBMB大模型工具體系「全家桶」。
工具學習也是面壁智能繼高效率訓練、微調、推理、壓縮套件後推出的又一大力作。
BMTools工具包:https ://www.php.cn/link/a330f9fecc388ce67f87b09855480ca3
#面壁智能聯合來自清華、人大、騰訊的研究人員共同發布了中文領域首個基於交互式網頁搜索的問答開源模型框架WebCPM,這一創舉填補了國產大模型該領域的空白。而WebCPM正是BMTools的成功實踐。
目前,WebCPM相關工作已錄用於自然語言處理頂級會議ACL 2023。
WebCPM論文連結:https://arxiv.org/abs/2305.06849
WebCPM數據與程式碼連結:https://github.com/thunlp/WebCPM
可以說,自從ChatGPT爆火之後,國內各家各派的大模型雨後春筍般湧現,但大部分模型都沒有連網。
而沒有聯網的大模型無法獲取最新的信息,生成的內容基於陳舊的數據集,存在一定的局限性。
WebCPM的特點在於其資訊檢索基於互動網頁搜索,能夠像人類一樣與搜尋引擎互動從而收集回答問題所需的事實性知識並產生答案。
換言之,大模型在聯網功能的加持下,回答問題的即時性和準確性都得到了飛躍式增強。
WebCPM模型框架
WebCPM對標的是WebGPT , WebGPT也正是微軟近期推出的New Bing背後的新一代搜尋技術。
同WebGPT一樣,WebCPM克服了傳統的LFQA( Long-form Question Answering)長文本開放問答範式的缺陷:依賴非互動式的檢索方法,即僅使用原始問題作為查詢語句來檢索資訊。
在WebCPM框架下,模型能夠像人類一樣透過與搜尋引擎即時互動來進行網頁搜尋而篩選高品質資訊。
不僅如此,遇到複雜問題,模型也像人類一般將其分解成多個子問題並依序提問。
而且,透過識別和瀏覽相關信息,模型還會逐漸完善對原問題的理解,並不斷查詢新問題來搜尋更多樣的信息。
WebCPM搜尋互動介面
未來,面壁智能也將進一步促進此科研成果的應用轉化,並努力推動WebCPM大模型在對應領域落地生根。
#面壁智能始終努力引領大模型原始創新,致力於建構智慧時代大模型基礎設施與打造國產大模型系統,以期最終實現「讓大模型飛入千家萬戶」。
面壁智能的成果有目共睹,並且獲得了業界肯定。
知乎技術長李大海曾評價面壁智慧:「面壁智慧團隊是國內最早進行大規模語言模型研究的團隊。公司儲備大模型研究與應用的全端技術能力,包括微調技術和加速技術等,研發能力處於行業領先地位。」知乎表示,相信面壁智能能成長為中國大模型領域基礎設施核心廠商,為中國大模型事業貢獻力量。
。工具平台和大模型庫,公司推出ModelForce模力大模型系統和CPM企業級大模型
。基於大模型的AI生產力平台ModelForce內建大模型訓練、微調、壓縮、推理全流程高效運算工具體系。平台基於大模型少樣本、零樣本通用能力,使用大模型標準化微調方式、打造零程式碼微調客戶端,能夠大幅降低AI研發過程中的資料標註成本、算力成本、人力成本。
CPM大模型企業版針對開源版模型進行了能力升級,具有多能力融合、增量微調靈活適配、多場景應用等特點。
基於CPM企業級大模型與ModelForce大模型系統,面壁智能與知乎的合作訓練了「知海圖AI」大模型
。,透過整合頂尖高校學術研究力量並持續打造營運大模式開源社群OpenBMB,面壁智慧搭建起業界需求、演算法開源和產業落地三者的閉迴路通道,竭盡所能促進國產大模型領域的前沿研究、應用研發和產業發展。
#########################OpenBMB開源社群############################OpenBMB開源社群############## ####為建立國內大模型開源生態貢獻力量,發布了包括OpenPrompt、OpenDelta、BMInf、BMcook、BMTrain、BMTools等一系列大模型全流程開源工具包,並且在知乎、B站等平台推出了大模型全民公開課。 ######作為在大學中一騎絕塵的研究力量,成立於上世紀70年代,是國內開展NLP研究最早、深具影響力的科研單位,多名知名學者和科學家坐鎮,在語言大模型領域的研究工作十分突出。
#致力於大模型在人工智慧典型場景與領域的應用與落地,CPM大模型是面壁團隊根據多年的大模型訓練經驗自研的預訓練語言大模型。公司目前已完成數千萬元天使輪融資,並多家知名機構與公司達成策略合作。
在努力打造國產大模型系統的旅程中,面壁智慧的願景始終是讓大模型落地賦能更多產業、惠及更多的企業和個人。
星火已燎原,我們期待大模型在更多領域釋放潛能,展現令人驚訝的應用價值。
以上是國產開源版「ChatGPT插件系統」來了!豆瓣、搜尋一應俱全,清華、面壁智慧等聯合發布的詳細內容。更多資訊請關注PHP中文網其他相關文章!