350億參數、開放權重,Transformer作者創業後推出新大模型
今天,由 Transformer 作者之一 Aidan Gomez 參與創立的人工智慧新創公司 Cohere 迎來了自家大模型的發布。
Cohere 最新發布的模型被命名為“Command-R”,擁有 35B 參數量,專為處理大規模生產工作負載而設計。此模型屬於「可擴展」類別,具備高效率和高精度的平衡特性,有助於企業用戶在超越概念驗證的基礎上進入生產階段。
Command-R 是一種生成模型,專門針對檢索增強生成(RAG)以及其他長上下文任務進行最佳化。透過結合外部 API 和工具,該模型旨在提高 RAG 應用程式的效能。它與行業領先的嵌入和重新排序模型協同工作,為企業用例提供出色的表現和一流的整合能力。
Command-R採用了經過最佳化的transformer架構,是一種自回歸語言模型。在預訓練完成後,模型透過監督微調(SFT)和偏好訓練的方式來確保與人類偏好保持一致,以實現更好的有用性和安全性。
具體而言,Command-R 具有以下功能特徵:
- RAG 和工具使用方面的高度準確性
- 低延遲、高吞吐量
- 更長的128k 上下文和更低的價格
- 跨10 種主要語言的強大功能
- HuggingFace 上提供模型權重以供研究和評估
##Command-R目前可在Cohere的託管API上使用,並計劃不久將在主要雲端服務商上推出。這個版本是一系列模型中的首個,旨在提升對企業大規模採用至關重要的功能。
目前,Cohere 在 Huggingface 上開放了模型權重。
Huggingface 網址:https://huggingface.co/CohereForAI/c4ai-command-r-v01
高效能檢索增強產生(RAG)
檢索增強產生(RAG)已成為大語言模型部署中的關鍵模式。透過 RAG,企業能夠讓模型存取原本無法獲得的私有知識,搜尋私人資料庫並使用相關資訊形成回應,從而準確性和實用性將顯著提升。 RAG 的關鍵元件是:
- 檢索:搜尋與回應使用者相關的資訊語料庫。
- 增強產生:使用檢索到的資訊形成更明智的回應。
對於檢索,Cohere 的Embed 模型透過搜尋數百萬甚至數十億文件來改善上下文和語義理解,顯著提高了檢索步驟的實用性和準確性。同時,Cohere 的 Rerank 模型有助於進一步提高檢索資訊的價值,優化相關性和個人化等自訂指標的結果。
對於增強生成,透過識別最相關的訊息,Command-R 可以總結、分析、包裝這些信息,並幫助員工提高工作效率或創造全新的產品體驗。 Command-R 的獨特之處在於:此模型的輸出帶有明確的引文,可降低幻覺的風險,並能夠從來源材料中呈現更多背景資訊。
即使不使用自家的 Embed 和 Rerank 模型,Command-R 在可擴展的生成模型類別中也優於其他模型。不過當配合使用時,領先優勢顯著擴大,從而在更複雜的領域實現更高的性能。
下圖左為Command-R 與Mixtral 在一系列與企業相關的RAG 應用程式上,進行了Head-to-Head 整體人類偏好評估,充分考慮流暢度、答案實用性和引用。圖右為 Command-R(Embed Rerank)、Command-R 與 Llama 2 70B(chat)、Mixtral、GPT3.5-Turbo 等模型在 Natural Questions、TriviaQA 和 HotpotQA 等基準上的比較結果。 Cohere 的大模型實現了領先。
#
強大的工具使用能力
大語言模型應該是核心的推理引擎,可以自動執行任務並採取實際行動,而不僅僅提取和生成文本的機器。 Command-R 透過使用工具(API)來實現這一目標,例如程式碼解釋器和其他使用者定義的工具,使模型能夠自動執行高度複雜的任務。
Tool Use 功能可讓企業開發人員將Command-R 轉變為引擎,以支援需要使用「資料庫和軟體工具等內部基礎設施」以及「CRM、搜尋引擎等外部工具”的任務和工作流程的自動化。這樣一來,我們可以實現跨多個系統且需要複雜推理和決策的耗時手動任務的自動化。
下圖為 Command-R 與 Llama 2 70B(chat)、Mixtral、GPT3.5-turbo,在使用搜尋工具時的多步驟推理能力比較。這裡使用到的資料集為 HotpotQA 和 Bamboogle。
多語言生成能力
Command-R 模型擅長全球10 種主要商業語言,包括英語、法語、西班牙語、義大利語、德語、葡萄牙語、日語、韓語、阿拉伯語和中文。
此外,Cohere 的 Embed 和 Rerank 模型本身就支援 100 多種語言。這使得用戶能夠從大量資料來源中得出答案,無論使用何種語言,都能以母語提供清晰準確的對話。
下圖為 Command-R 與 Llama 2 70B(chat)、Mixtral、GPT3.5-turbo 在多語言 MMLU 和 FLORES 上的比較。
更長的上下文和更低的價格
Command-R 支持了更長的上下文視窗——128k tokens。此次升級也降低了 Cohere 託管 API 的價格,並顯著提高了 Cohere 私有雲部署的效率。透過將更長的上下文視窗與更便宜的定價相結合,Command-R 解鎖了 RAG 用例,其中附加上下文可以顯著提高效能。
具體定價如下,其中Command 版本100 萬輸入tokens 1 美元,100 萬輸出tokens 2 美元;Command-R 版本100 萬輸入tokens 0.5 美元,100 萬輸出tokens 1.5 美元。
不久後,Cohere 也將放出一份簡短的技術報告,展示更多模型細節。
部落格網址:https://txt.cohere.com/command-r/
以上是350億參數、開放權重,Transformer作者創業後推出新大模型的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

熱門話題

DDREASE是一種用於從檔案或區塊裝置(如硬碟、SSD、RAM磁碟、CD、DVD和USB儲存裝置)復原資料的工具。它將資料從一個區塊設備複製到另一個區塊設備,留下損壞的資料區塊,只移動好的資料區塊。 ddreasue是一種強大的恢復工具,完全自動化,因為它在恢復操作期間不需要任何干擾。此外,由於有了ddasue地圖文件,它可以隨時停止和恢復。 DDREASE的其他主要功能如下:它不會覆寫恢復的數據,但會在迭代恢復的情況下填補空白。但是,如果指示工具明確執行此操作,則可以將其截斷。將資料從多個檔案或區塊還原到單

0.這篇文章乾了啥?提出了DepthFM:一個多功能且快速的最先進的生成式單目深度估計模型。除了傳統的深度估計任務外,DepthFM還展示了在深度修復等下游任務中的最先進能力。 DepthFM效率高,可以在少數推理步驟內合成深度圖。以下一起來閱讀這項工作~1.論文資訊標題:DepthFM:FastMonocularDepthEstimationwithFlowMatching作者:MingGui,JohannesS.Fischer,UlrichPrestel,PingchuanMa,Dmytr

谷歌力推的JAX在最近的基準測試中表現已經超過Pytorch和TensorFlow,7項指標排名第一。而且測試並不是JAX性能表現最好的TPU上完成的。雖然現在在開發者中,Pytorch依然比Tensorflow更受歡迎。但未來,也許有更多的大型模型會基於JAX平台進行訓練和運行。模型最近,Keras團隊為三個後端(TensorFlow、JAX、PyTorch)與原生PyTorch實作以及搭配TensorFlow的Keras2進行了基準測試。首先,他們為生成式和非生成式人工智慧任務選擇了一組主流

波士頓動力Atlas,正式進入電動機器人時代!昨天,液壓Atlas剛「含淚」退出歷史舞台,今天波士頓動力就宣布:電動Atlas上崗。看來,在商用人形機器人領域,波士頓動力是下定決心要跟特斯拉硬剛一把了。新影片放出後,短短十幾小時內,就已經有一百多萬觀看。舊人離去,新角色登場,這是歷史的必然。毫無疑問,今年是人形機器人的爆發年。網友銳評:機器人的進步,讓今年看起來像人類的開幕式動作、自由度遠超人類,但這真不是恐怖片?影片一開始,Atlas平靜地躺在地上,看起來應該是仰面朝天。接下來,讓人驚掉下巴

在iPhone上面臨滯後,緩慢的行動數據連線?通常,手機上蜂窩互聯網的強度取決於幾個因素,例如區域、蜂窩網絡類型、漫遊類型等。您可以採取一些措施來獲得更快、更可靠的蜂窩網路連線。修復1–強制重啟iPhone有時,強制重啟設備只會重置許多內容,包括蜂窩網路連線。步驟1–只需按一次音量調高鍵並放開即可。接下來,按降低音量鍵並再次釋放它。步驟2–過程的下一部分是按住右側的按鈕。讓iPhone完成重啟。啟用蜂窩數據並檢查網路速度。再次檢查修復2–更改資料模式雖然5G提供了更好的網路速度,但在訊號較弱

哭死啊,全球狂煉大模型,一網路的資料不夠用,根本不夠用。訓練模型搞得跟《飢餓遊戲》似的,全球AI研究者,都在苦惱怎麼才能餵飽這群資料大胃王。尤其在多模態任務中,這問題尤其突出。一籌莫展之際,來自人大系的初創團隊,用自家的新模型,率先在國內把「模型生成數據自己餵自己」變成了現實。而且還是理解側和生成側雙管齊下,兩側都能產生高品質、多模態的新數據,對模型本身進行數據反哺。模型是啥?中關村論壇上剛露面的多模態大模型Awaker1.0。團隊是誰?智子引擎。由人大高瓴人工智慧學院博士生高一鑷創立,高

什麼?瘋狂動物城被國產AI搬進現實了?與影片一同曝光的,是一款名為「可靈」全新國產影片生成大模型。 Sora利用了相似的技術路線,結合多項自研技術創新,生產的影片不僅運動幅度大且合理,還能模擬物理世界特性,具備強大的概念組合能力與想像。數據上看,可靈支持生成長達2分鐘的30fps的超長視頻,分辨率高達1080p,且支援多種寬高比。另外再劃個重點,可靈不是實驗室放出的Demo或影片結果演示,而是短影片領域頭部玩家快手推出的產品級應用。而且主打一個務實,不開空頭支票、發布即上線,可靈大模型已在快影

特斯拉機器人Optimus最新影片出爐,已經可以在工廠裡打工了。正常速度下,它分揀電池(特斯拉的4680電池)是這樣的:官方還放出了20倍速下的樣子——在小小的「工位」上,揀啊揀啊揀:這次放出的影片亮點之一在於Optimus在廠子裡完成這項工作,是完全自主的,全程沒有人為的干預。而且在Optimus的視角之下,它還可以把放歪了的電池重新撿起來放置,主打一個自動糾錯:對於Optimus的手,英偉達科學家JimFan給出了高度的評價:Optimus的手是全球五指機器人裡最靈巧的之一。它的手不僅有觸覺
