輕量版ChatGPT訓練方法開源！僅用3天圍繞LLaMA打造，號稱訓練速度比OpenAI快15倍-人工智慧-PHP中文網

把LLaMA訓練成ChatGPT的「開源方法」

首頁

科技週邊

人工智慧

輕量版ChatGPT訓練方法開源！僅用3天圍繞LLaMA打造，號稱訓練速度比OpenAI快15倍

PHPz

Apr 13, 2023 pm 05:13 PM

程式碼訓練 lama

基於Meta模型打造的輕量版ChatGPT，這就來啦？

Meta宣布推出LLaMA才三天，業界就出現了把它打造成ChatGPT的開源訓練方法，號稱比ChatGPT訓練速度最高快15倍。

LLaMA是Meta推出的超快超小型GPT-3，參數量只有後者的10%，只需要單張GPU就能運作。

把它變成ChatGPT的方法叫做ChatLLaMA，基於RLHF（基於人類回饋的強化學習）進行訓練，在網路上很快就掀起了一陣熱度。

輕量版ChatGPT訓練方法開源！僅用3天圍繞LLaMA打造，號稱訓練速度比OpenAI快15倍

所以，Meta的開源版ChatGPT真的要來了？

先等等，事情倒也沒那麼簡單。

把LLaMA訓練成ChatGPT的「開源方法」

點進ChatLLaMA專案首頁來看，會發現它實際上整合了四個部分－

DeepSpeed、 RLHF方法、LLaMA和基於LangChain agent產生的資料集。

其中，DeepSpeed是一個開源深度學習訓練最佳化庫，包含名叫Zero的現存最佳化技術，用於提升大模型訓練能力，具體指幫模型提升訓練速度、降低成本、提升模型可用性等。

RLHF則會採用獎勵模型來微調預訓練模型。獎勵模型即先用多個模型產生問題問答，再依靠人工對問答進行排序，讓它學會打分；隨後，基於獎勵學習給模型生成的回答進行打分，透過強化學習的方式增強模型能力。

LangChain是一個大語言模型應用程式開發庫，希望將各種大語言模型整合起來，結合其他知識來源或運算能力來創建一個實用的應用程式。 LangChain agent則會像思維鏈一樣放出GPT-3思考的整個過程，將操作記錄下來。

這時候你會發現，最關鍵的依舊是LLaMA的模型權重。它從哪裡來？

嘿嘿，自己去找Meta申請吧，ChatLLaMA並不提供。（雖然Meta聲稱開源LLaMA，但依舊需要申請）

輕量版ChatGPT訓練方法開源！僅用3天圍繞LLaMA打造，號稱訓練速度比OpenAI快15倍

所以本質上來說，ChatLLaMA並不是一個開源ChatGPT項目，而只是一種基於LLaMA的訓練方法，其庫內整合的幾個專案原本也都是開源的。

實際上，ChatLLaMA也並非由Meta打造，而是來自一個叫做Nebuly AI的新創AI企業。

Nebuly AI做了一個叫做Nebullvm的開源函式庫，裡面整合了一系列即插即用的最佳化模組，用來提升AI系統效能。

例如這是Nebullvm目前包含的一些模組，包括基於DeepMind開源的AlphaTensor演算法打造的OpenAlphaTensor、自動感知硬體並對其進行加速的最佳化模組…

輕量版ChatGPT訓練方法開源！僅用3天圍繞LLaMA打造，號稱訓練速度比OpenAI快15倍

#ChatLLaMA也在這一系列模組中，但要注意的是它的開源license也是不可商用的。

所以「國產自研ChatGPT」想要直接拿去用，可能還沒那麼簡單（doge）。

看完這個專案後，有網友表示，要是有人真搞到LLaMA的模型權重（程式碼）就好了…

輕量版ChatGPT訓練方法開源！僅用3天圍繞LLaMA打造，號稱訓練速度比OpenAI快15倍

但也有網友指出，「比ChatGPT訓練方法快15倍」這種說法是純粹的誤導：

所謂的快15倍只是因為LLaMA模型本身很小，甚至能在單一GPU上運行，但應該不是因為這個專案所做的任何事情吧？

輕量版ChatGPT訓練方法開源！僅用3天圍繞LLaMA打造，號稱訓練速度比OpenAI快15倍

這位網友也推薦了一個比庫中效果更好的RLHF訓練方法，名叫trlx，訓練速度要比通常的RLHF方法快上3~4倍：

輕量版ChatGPT訓練方法開源！僅用3天圍繞LLaMA打造，號稱訓練速度比OpenAI快15倍

你拿到LLaMA的程式碼了嗎？覺得這個訓練方法如何？

ChatLLaMA網址：https://www.php.cn/link/fed537780f3f29cc5d5f313bbda423c4

參考連結：https://www.php.cn/link/fe27f92b1e3f4997567807f38d567a35

以上是輕量版ChatGPT訓練方法開源！僅用3天圍繞LLaMA打造，號稱訓練速度比OpenAI快15倍的詳細內容。更多資訊請關注PHP中文網其他相關文章！

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

熱工具

熱門話題

gmail信箱登陸入口在哪裡

7754

Java教學

1643

CakePHP 教程

1398

Laravel 教程

1293

PHP教程

1234

Related knowledge

開源！超越ZoeDepth！ DepthFM：快速且精確的單目深度估計！ Apr 03, 2024 pm 12:04 PM

0.這篇文章乾了啥？提出了DepthFM：一個多功能且快速的最先進的生成式單目深度估計模型。除了傳統的深度估計任務外，DepthFM還展示了在深度修復等下游任務中的最先進能力。 DepthFM效率高，可以在少數推理步驟內合成深度圖。以下一起來閱讀這項工作~1.論文資訊標題：DepthFM:FastMonocularDepthEstimationwithFlowMatching作者：MingGui,JohannesS.Fischer,UlrichPrestel,PingchuanMa,Dmytr

藍色畫面代碼0x0000001怎麼辦 Feb 23, 2024 am 08:09 AM

藍屏代碼0x0000001怎麼辦藍屏錯誤是電腦系統或硬體出現問題時的一種警告機制，代碼0x0000001通常表示出現了硬體或驅動程式故障。當使用者在使用電腦時突然遇到藍色畫面錯誤，可能會感到驚慌失措。幸運的是，大多數藍色畫面錯誤都可以透過一些簡單的步驟來排除和處理。本文將為讀者介紹一些解決藍屏錯誤代碼0x0000001的方法。首先，當遇到藍色畫面錯誤時，我們可以嘗試重

你好，電動Atlas！波士頓動力機器人復活，180度詭異動作嚇到馬斯克 Apr 18, 2024 pm 07:58 PM

波士頓動力Atlas，正式進入電動機器人時代！昨天，液壓Atlas剛「含淚」退出歷史舞台，今天波士頓動力就宣布：電動Atlas上崗。看來，在商用人形機器人領域，波士頓動力是下定決心要跟特斯拉硬剛一把了。新影片放出後，短短十幾小時內，就已經有一百多萬觀看。舊人離去，新角色登場，這是歷史的必然。毫無疑問，今年是人形機器人的爆發年。網友銳評：機器人的進步，讓今年看起來像人類的開幕式動作、自由度遠超人類，但這真不是恐怖片？影片一開始，Atlas平靜地躺在地上，看起來應該是仰面朝天。接下來，讓人驚掉下巴

超級智能體生命力覺醒！可自我更新的AI來了，媽媽再也不用擔心資料瓶頸難題 Apr 29, 2024 pm 06:55 PM

哭死啊，全球狂煉大模型，一網路的資料不夠用，根本不夠用。訓練模型搞得跟《飢餓遊戲》似的，全球AI研究者，都在苦惱怎麼才能餵飽這群資料大胃王。尤其在多模態任務中，這問題尤其突出。一籌莫展之際，來自人大系的初創團隊，用自家的新模型，率先在國內把「模型生成數據自己餵自己」變成了現實。而且還是理解側和生成側雙管齊下，兩側都能產生高品質、多模態的新數據，對模型本身進行數據反哺。模型是啥？中關村論壇上剛露面的多模態大模型Awaker1.0。團隊是誰？智子引擎。由人大高瓴人工智慧學院博士生高一鑷創立，高

快手版Sora「可靈」開放測試：生成超120s視頻，更懂物理，複雜運動也能精準建模 Jun 11, 2024 am 09:51 AM

什麼？瘋狂動物城被國產AI搬進現實了？與影片一同曝光的，是一款名為「可靈」全新國產影片生成大模型。 Sora利用了相似的技術路線，結合多項自研技術創新，生產的影片不僅運動幅度大且合理，還能模擬物理世界特性，具備強大的概念組合能力與想像。數據上看，可靈支持生成長達2分鐘的30fps的超長視頻，分辨率高達1080p，且支援多種寬高比。另外再劃個重點，可靈不是實驗室放出的Demo或影片結果演示，而是短影片領域頭部玩家快手推出的產品級應用。而且主打一個務實，不開空頭支票、發布即上線，可靈大模型已在快影

GE通用遠端程式碼可在任何裝置上編程 Mar 02, 2024 pm 01:58 PM

如果您需要遠端編程任何設備，這篇文章會為您帶來幫助。我們將分享編程任何設備的頂級GE通用遠端代碼。通用電氣的遙控器是什麼？ GEUniversalRemote是一款遙控器，可用於控制多個設備，如智慧電視、LG、Vizio、索尼、藍光、DVD、DVR、Roku、AppleTV、串流媒體播放器等。 GEUniversal遙控器有各種型號，具有不同的功能和功能。 GEUniversalRemote最多可以控制四台設備。頂級通用遙控器代碼，可在任何裝置上編程GE遙控器配備一組代碼，使其能夠與不同設備配合。您可

美國空軍高調展示首個AI戰鬥機！部長親自試駕全程未乾預，10萬行代碼試飛21次 May 07, 2024 pm 05:00 PM

最近，軍事圈被這個消息刷屏了：美軍的戰鬥機，已經能由AI完成全自動空戰了。是的，就在最近，美軍的AI戰鬥機首次公開，揭開了神秘面紗。這架戰鬥機的全名是可變穩定性飛行模擬器測試飛機（VISTA），由美空軍部長親自搭乘，模擬了一對一的空戰。 5月2日，美國空軍部長FrankKendall在Edwards空軍基地駕駛X-62AVISTA升空注意，在一小時的飛行中，所有飛行動作都由AI自主完成！ Kendall表示——在過去的幾十年中，我們一直在思考自主空對空作戰的無限潛力，但它始終顯得遙不可及。然而如今，

全面超越DPO：陳丹琦團隊提出簡單偏好優化SimPO，也煉出最強8B開源模型 Jun 01, 2024 pm 04:41 PM

為了將大型語言模型（LLM）與人類的價值和意圖對齊，學習人類回饋至關重要，這能確保它們是有用的、誠實的和無害的。在對齊LLM方面，一種有效的方法是根據人類回饋的強化學習（RLHF）。儘管RLHF方法的結果很出色，但其中涉及了一些優化難題。其中涉及訓練一個獎勵模型，然後優化一個策略模型來最大化該獎勵。近段時間已有一些研究者探索了更簡單的離線演算法，其中之一就是直接偏好優化（DPO）。 DPO是透過參數化RLHF中的獎勵函數來直接根據偏好資料學習策略模型，這樣就無需顯示式的獎勵模型了。此方法簡單穩定

See all articles

輕量版ChatGPT訓練方法開源！僅用3天圍繞LLaMA打造，號稱訓練速度比OpenAI快15倍

把LLaMA訓練成ChatGPT的「開源方法」

熱AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

熱門文章

熱工具

記事本++7.3.1

SublimeText3漢化版

禪工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

熱門話題