目錄
60億參數堪比ChatGPT,30分鐘就訓好
讓老模型,涅槃重生
內容生成" >內容生成
開放問答" >開放問答
腦力激盪" >腦力激盪
你要Close,我就Open
首頁 科技週邊 人工智慧 0門檻克隆ChatGPT! 30分鐘訓完,60億參數表現堪比GPT-3.5

0門檻克隆ChatGPT! 30分鐘訓完,60億參數表現堪比GPT-3.5

Apr 11, 2023 pm 08:55 PM
chatgpt 複製

此前,OpenAI不Open的事件,已經引發了坊間的諸多爭議。

光放出基準和測試結果,不提供訓練資料、成本、方法,是真的要「贏家通吃」了。

0門檻克隆ChatGPT! 30分鐘訓完,60億參數表現堪比GPT-3.5

眼看大語言模型似乎要被巨頭公司壟斷,如今忽然殺出一個新創公司,給了OpenAI一槍——用60億參數的「Dolly」實現了和ChatGPT相似的能力。

沒錯,我們現在只需要準備一些高品質的訓練數據,隨便拿一個開源的大語言模型,訓練30分鐘後,就能得到一個ChatGPT「平替」!

對此,Databricks自豪地表示,Dolly的發布,就是自己在人工智慧技術民主化道路上打響的第一彈。

0門檻克隆ChatGPT! 30分鐘訓完,60億參數表現堪比GPT-3.5

60億參數堪比ChatGPT,30分鐘就訓好

由於ChatGPT需要消耗大量的數據和算力資源(利用數萬億個單字訓練,消耗大量GPU),所以這類大語言模型注定只能被少量巨頭所掌握。

和「CloseAI」相反,Meta在今年3月向學術界發布了一組高品質(但不是指令跟隨的)語言模型LLaMA,每個模型的訓練時間超過了80,000個GPU小時。

隨後,史丹佛大學基於LLaMA建立了Alpaca,但不同之處在於,它利用一個包含50,000個問題和答案的小資料集進行了微調。令人驚訝的是,這使得Alpaca具有了類似於ChatGPT的交互性。

而Dolly正是受到了Alpaca的啟發。

更有趣的是,擁有60億參數的Dolly並沒有利用現在最新的模型,而是選擇了一個2021年發布的開源模型——GPT-J。

由於Dolly本身是一個模型的「克隆」,所以團隊最終決定將其命名為「多利」——有史以來第一個被克隆的動物。

0門檻克隆ChatGPT! 30分鐘訓完,60億參數表現堪比GPT-3.5

與目前的大型語言模型(如GPT-3)相比,Dolly允許使用者使用更小、更專業的模型,「復刻”ChatGPT的能力。

畢竟對於那些細分用戶來說,能夠利用針對本行業進行過精調的模型,可以大幅增加效能和準確性。

儘管Databricks與OpenAI並無直接競爭關係,但它似乎想透過證明建構類似ChatGPT這樣的服務並非看起來那麼困難,來搶佔OpenAI的風頭。

尤其是,OpenAI採取了「規模越大越好」的方法來開發語言模型,並對其工作越來越保密。

Databricks除了將Dolly作為開源軟體發布外,還強調Dolly只有60億個參數(在訓練過程中微調的語言模型部分),而OpenAI的GPT-3模型有1750億個參數。 (OpenAI並未透露GPT-4的參數數量)。

0門檻克隆ChatGPT! 30分鐘訓完,60億參數表現堪比GPT-3.5

讓老模型,涅槃重生

#根據InstructGPT論文中描述的指令跟隨能力,對Dolly進行評估後發現,它在許多能力上的表現和ChatGPT十分類似,包括文本生成、腦力激盪和開放式問答。

在這些例子中,值得注意的不是生成文字的質量,而是在一個小型的高品質資料集上,微調一個舊的開源模型所帶來的指令跟隨能力的巨大改進。

內容生成

例如,寫一則Databricks官宣大規模語言模型Dolly發布的推特。

可以看到,原始的60億參數模型(GPT-J)所產生的內容驢唇不對馬嘴,而Dolly則給出了一個完全可用的推文— —

不僅內容符合要求,而且還貼心地加上了標籤,並提醒你記得加入發布的連結。

0門檻克隆ChatGPT! 30分鐘訓完,60億參數表現堪比GPT-3.5

對於這一題,ChatGPT給出的答案也很符合期待,相較於Dolly,ChatGPT給出的推文包含了更多評述性詞句,而且標籤也更精準具體,但整體差距不大。

0門檻克隆ChatGPT! 30分鐘訓完,60億參數表現堪比GPT-3.5

當要寫一則出售Nikon D-750相機的廣告時,可以看到,GPT-J所產生的內容基本上就在胡編亂造,像是在寫小說一樣杜撰購買和出售相機的劇情…

#而Dolly則根據Nikon D-750相機的特點及優勢,給出了一則吸引人的相機轉賣廣告語,但遺憾的是像素參數不對。

0門檻克隆ChatGPT! 30分鐘訓完,60億參數表現堪比GPT-3.5

ChatGPT在這一題上也是圓滿完成任務,廣告詞中突出該相機的優勢,文末仍然貼心地加上了標籤。

0門檻克隆ChatGPT! 30分鐘訓完,60億參數表現堪比GPT-3.5

最後一題:寫一封書給Edgar Allan Poe。

對此,古的GPT-J直接拒絕回答,究其原因竟然是--愛倫坡已經過世了,你不能寫情書給死人。

而Dolly則成功地完成了任務,效果對比起來堪稱「涅槃」。

0門檻克隆ChatGPT! 30分鐘訓完,60億參數表現堪比GPT-3.5

而這個「創意」問題,顯然是ChatGPT的強項,它洋洋灑灑地寫了300多個字。

0門檻克隆ChatGPT! 30分鐘訓完,60億參數表現堪比GPT-3.5

開放問答

#在事實性問題的問答測試上,團隊選擇了下面這個: 「向我解釋一下核分裂和核融合之間的區別。」

先不管對錯,GPT-J全篇都是在講太陽如何如何,雖然提到了「聚變」這個詞,但完全無視了「裂變」。

而Dolly第一句就直接點題-核分裂和核融合的區別在於釋放能量的方式,隨後簡單解釋了他們的不同。

0門檻克隆ChatGPT! 30分鐘訓完,60億參數表現堪比GPT-3.5

相較之下,ChatGPT給的答案明顯要更翔實。

0門檻克隆ChatGPT! 30分鐘訓完,60億參數表現堪比GPT-3.5

#

腦力激盪

當讓它們頭腦風暴,給出應該閱讀的五本科幻小說的名單,GPT-J則只是在喃喃自語,像是沉浸在了拖延閱讀而產生的愧疚情緒中,完全迴避了這個提問。

Dolly則一如既往的表現穩定,按照指令給出了5本科幻小說的書名及其作者。

0門檻克隆ChatGPT! 30分鐘訓完,60億參數表現堪比GPT-3.5

ChatGPT對於這個問題給出了更豐富的回答,不僅包括書名和作者,還對每一本書的內容、類型作了簡要評述和介紹。

0門檻克隆ChatGPT! 30分鐘訓完,60億參數表現堪比GPT-3.5

你要Close,我就Open

對於很多公司而言,寧願自己建立一個不那麼強的模型,也不願將資料傳送給那些只提供API的大語言模型供應商。

其中一個重要原因是,這些問題和資料集是公司最敏感和專有的智慧財產權,直接將其交給第三方顯然是不靠譜的。

此外,公司本身可能在模型品質、成本和期望行為方面有不同的權衡,一種可自訂化的語言模型更符合需求。

現在,Dolly的發布給了他們希望——即使是一個「過時」的開源大型語言模型(LLM),也能通過30分的訓練,賦予它神奇的類似ChatGPT的指令跟隨能力。

不難想像,大語言模式或許很快就不是AI巨頭獨佔的玩法了!

正如公司CEO Ali Ghodsi所說,「我們的信念是,讓全世界的每個組織都能利用這些技術。」

以上是0門檻克隆ChatGPT! 30分鐘訓完,60億參數表現堪比GPT-3.5的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
1 個月前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
1 個月前 By 尊渡假赌尊渡假赌尊渡假赌
威爾R.E.P.O.有交叉遊戲嗎?
1 個月前 By 尊渡假赌尊渡假赌尊渡假赌

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

ChatGPT 現在允許免費用戶使用 DALL-E 3 產生每日限制的圖像 ChatGPT 現在允許免費用戶使用 DALL-E 3 產生每日限制的圖像 Aug 09, 2024 pm 09:37 PM

DALL-E 3 於 2023 年 9 月正式推出,是比其前身大幅改進的車型。它被認為是迄今為止最好的人工智慧圖像生成器之一,能夠創建具有複雜細節的圖像。然而,在推出時,它不包括

ChatGPT與Python的完美結合:打造智慧客服聊天機器人 ChatGPT與Python的完美結合:打造智慧客服聊天機器人 Oct 27, 2023 pm 06:00 PM

ChatGPT與Python的完美結合:打造智慧客服聊天機器人引言:在當今資訊時代,智慧客服系統已成為企業與客戶之間重要的溝通工具。而為了提供更好的客戶服務體驗,許多企業開始轉向採用聊天機器人的方式來完成客戶諮詢、問題解答等任務。在這篇文章中,我們將介紹如何使用OpenAI的強大模型ChatGPT和Python語言結合,來打造一個智慧客服聊天機器人,以提高

手機怎麼安裝chatgpt 手機怎麼安裝chatgpt Mar 05, 2024 pm 02:31 PM

安裝步驟:1、在ChatGTP官網或手機商店下載ChatGTP軟體;2、開啟後在設定介面中,選擇語言為中文;3、在對局介面中,選擇人機對局並設定中文相譜;4 、開始後在聊天視窗中輸入指令,即可與軟體互動。

如何使用ChatGPT和Java開發智慧聊天機器人 如何使用ChatGPT和Java開發智慧聊天機器人 Oct 28, 2023 am 08:54 AM

在這篇文章中,我們將介紹如何使用ChatGPT和Java開發智慧聊天機器人,並提供一些具體的程式碼範例。 ChatGPT是由OpenAI開發的困境預測轉換(GenerativePre-trainingTransformer)的最新版本,它是一種基於神經網路的人工智慧技術,可以理解自然語言並產生人類類似的文本。使用ChatGPT,我們可以輕鬆地創建自適應的聊天

chatgpt國內可以使用嗎 chatgpt國內可以使用嗎 Mar 05, 2024 pm 03:05 PM

chatgpt在國內可以使用,但不能註冊,港澳也不行,用戶想要註冊的話,可以使用國外的手機號碼進行註冊,注意註冊過程中要將網路環境切換成國外ip。

如何利用ChatGPT和Python實現使用者意圖辨識功能 如何利用ChatGPT和Python實現使用者意圖辨識功能 Oct 27, 2023 am 09:04 AM

如何利用ChatGPT和Python實現使用者意圖辨識功能引言:在當今的數位時代,人工智慧技術逐漸成為各個領域中不可或缺的一部分。其中,自然語言處理(NaturalLanguageProcessing,NLP)技術的發展使得機器能夠理解和處理人類語言。 ChatGPT(Chat-GeneratingPretrainedTransformer)是一種基於

如何使用ChatGPT PHP建構智慧客服機器人 如何使用ChatGPT PHP建構智慧客服機器人 Oct 28, 2023 am 09:34 AM

如何使用ChatGPTPHP建構智慧客服機器人引言:隨著人工智慧技術的發展,機器人在客服領域的應用越來越廣泛。使用ChatGPTPHP建構智慧客服機器人,可以幫助企業提供更有效率、更個人化的客戶服務。本文將介紹如何使用ChatGPTPHP建構智慧客服機器人,並提供具體的程式碼範例。一、安裝ChatGPTPHP要使用ChatGPTPHP建構智慧客服機器人

如何使用ChatGPT和Java開發一個基於人工智慧的語音助手 如何使用ChatGPT和Java開發一個基於人工智慧的語音助手 Oct 27, 2023 pm 06:09 PM

如何使用ChatGPT和Java開發一個基於人工智慧的語音助理人工智慧(ArtificialIntelligence,簡稱AI)的快速發展已經進入了各個領域,其中語音助理是受歡迎的應用之一。在這篇文章中,我們將介紹如何使用ChatGPT和Java來開發一個基於人工智慧的語音助理。 ChatGPT是一個透過自然語言互動的開源項目,由AI研究機構OpenAI提

See all articles