AIGC 產業最大的兩個競爭對手:ChatGPT vs Google Bard! 本文介紹這兩個人工智慧引擎之間的技術差異。
譯者| 崔皓
審校| 孫淑娟
#開篇
AIGC 業界最大的兩個競爭對手:ChatGPT vs Google Bard! 本文介紹這兩個人工智慧引擎之間的技術差異。
截至目前Google Bard和ChatGPT之間最大的差異是:Bard知道ChatGPT,但ChatGPT對Bard懵然不知。雖然我們可以玩轉ChatGPT,而Bard對我們大多數人來說仍然遙不可及。
ChatGPT與Google Bard之戰的開始
ChatGPT和Google Bard都是人工智慧聊天機器人。人工智慧的簡易版本已經可以在手機上使用了,當你輸入 "good"時,手機就可以預測下一個字是 "morning"。
ChatGPT最初是由OpenAI開發的,然後由微軟以令人瞠目結舌的100億美元(除了早先的10億美元投資外)進行投資。谷歌方面,對他們的搜尋壟斷可能要結束而略感恐慌,因此推出了Bard,但這個版本仍然存在一些缺陷。在第一次現場演示中,Bard犯了幾個事實性錯誤,讓Google感到很尷尬。
ChatGPT和Google Bard比智慧型手機的預測文字功能更複雜,如果說要了解這兩款智慧機器人之間的差異,下面的內容你就不能錯過了。
這裡我們會深入描述兩個人工智慧引擎之間的技術差異。
ChatGPT與Bard:內藏玄機?
我們可以透過以下表格快速了解它們之間的技術差異,透過表格可以看到很多細節。
|
ChatGPT |
#Bard |
|
#模型
|
#GPT-3.5
| ##LaMDA,即對話應用的語言模型
| 神經網路結構
###Transformer### |
Transformer |
訓練資料 |
網路文本,主要是被稱為"commoncrawl"的資料集,在2021年中期截止。 |
156萬字的公共對話資料和網路文字 |
目的 |
成為一個多用途的文本生成聊天機器人 |
專門協助搜尋 |
##參數
|
1750億參數
|
1370億參數
|
|
|
|
|
# #創建者
###OpenAI############Google###############################Google##################優勢############- 對所有人開放######- 更靈活,能夠處理開放式文字######- 訓練資料截止到2021年### |
- 訓練資料截止到目前
- 專門為對話而訓練,所以當你和它對話的時候,聽起來更像人。
|
劣勢 |
- 對話沒有那麼有說服力
- 沒有那麼仔細的微調
|
- 目前還沒有
- 可能不那麼適合一般的文字創作
|
##透過上面的表格了解了兩者之間的差異,接下來讓我們深入了解其他指標。
什麼是ChatGPT?
ChatGPT於2022年11月30日突然出現在舞台上。到2022年12月4日,該服務每天有超過一百萬的用戶。 2023年1月,這個數字膨脹到1億多用戶。
它突然這麼受歡迎其基本原因是,它能以一種聽起來幾乎是人類的方式,為你提供許多主題的可靠回答,而且任何能夠上網的人都可以使用它。
ChatGPT是OpenAI創建的,OpenAI是一家位於舊金山的人工智慧實驗室,專注於創造友善的人工智慧方案。該聊天機器人是基於GPT-3.5開發的,GPT-3.5是一個大型語言模型,當給定文字時,可以持續給請求者回應。
ChatGPT在此基礎上增加了一些額外的訓練--人類培訓師透過與模型的互動改進了模型,並透過"獎勵 "的方式讓模型具備提供高品質答案的能力。
訓練資料
GPT-3.5是在一個巨大的網路文字資料集上訓練的,包括一個叫做Common Crawl的流行資料集。 Common Crawl包含PB級的網路數據,包括原始網頁資料、元資料擷取和文字擷取。例如,它包括來自StrataScratch的URLs集合。想想ChatGPT使用訓練的資料來自網友在ChatGPT的輸入,這是不是很瘋狂?
Common Crawl負責60%的訓練數據,但GPT-3.5也有其他數據來源。
什麼是Google Bard?
Google Bard 是在ChatGPT大受追捧的情況下,由Google推出的智慧聊天機器人。與ChatGPT不同,Bard是由Google自己的模型LaMDA驅動。 LaMDA是對話應用語言模型的簡稱,與ChatGPT不同的是,它沒有那麼驚艷,原因很簡單,大多數人還不能訪問它。儘管Google在2月初確實搞了一個充滿尷尬的Bard演示,但目前Bard只對少數人開放。
Google Bard的主要優勢是它對網路開放。問ChatGPT“現在誰是總統?”,它是不知道的。這是因為訓練資料在2021年中期左右被切斷了。而Bard則是藉鏡了今天網路上的資訊。從理論上講,Bard應該能夠從今天互聯網上的數據中提取,告訴你現在誰是總統。
很容易看出Bard在幾個關鍵方面是如何從ChatGPT中脫穎而出的。
訓練資料
首先,LaMDA是在對話中訓練的,專門用於對話,而不是像GPT-n模型那樣只產生文本。雖然ChatGPT對其訓練資料不加掩飾,但我們對Bard所訓練的資料還不甚了解,可以透過查看LaMDA的研究論文來推論。谷歌的研究人員說,12.5%的訓練資料來自Common Crawl,例如GPT-n模型。另外12.5%來自維基百科。而根據研究論文,他們使用了1.56兆字的 "公共對話資料和網路文本"。
以下是完整的分類:
- 12.5%基於C4的資料(Common Crawl資料的衍生性商品)。
- 12.5%的英文維基百科
- 12.5%來自程式問答網站、教學課程和其他的程式碼文件
- 6.25%的英文網頁文件
- 6.25%的非英語網路文件
- 50%來自公共論壇的對話數據
從上面的資訊可以知道兩者共同利用的數據,顯然有維基百科。其餘的數據明顯是Google故意隱藏的,大概是為了保護Bard(和LaMDA)不被模仿。
LaMDA是透過微調Transformer的神經語言模型而形成的,它是一個最初由Google開發的開源神經網路架構。 (GPT也是建立在Transformer的基礎上)。
ChatGPT存在一些壁壘,以防止它讓人生厭或說一些廢話,但谷歌強調如何保證質量,以使Bard變成更好、更安全的聊天機器人。 Bard經過微調,變得"高品質、接地氣和安全"。
Google對此有很多說法,我建議閱讀他們的相關博文,但如果你時間不多,基本上可以分成以下幾個方面:
- Bard應該給予有意義的回應--沒有荒謬的內容,沒有矛盾的內容
- Bard應作出有見地、詼諧或出人意料的回應。
- Bard應該避免任何有可能對使用者造成傷害的東西--血腥、偏見、可憎的刻板印像等
- Bard不胡編亂造
眾所周知,由於一次錯誤的發布,谷歌還沒有完全弄清楚底層需求。但值得注意的是,Google對設計要求說得很清楚,而ChatGPT沒有說的那麼清楚--至少目前是這樣。
ChatGPT與Google Bard比較:模型參數為什麼很重要?
ChatGPT確實比Bard擁有更多的模型參數--1750億對1370億。你可以把參數看成是模型調整的旋鈕或槓桿,以適應它所訓練的資料。更多的參數通常意味著模型有更多的能力來捕捉語言中的複雜關係,但也有過度擬合的風險。與ChatGPT相比,Google Bard可能不那麼靈活,但也可能因為新的語言用例使其更加強大。
ChatGPT與Google Bard:共同點?
值得強調的是,Bard和ChatGPT的模型(分別是LaMDA和GPT-3.5)都位於基於Transformer的深度學習神經網路。
例如,Transformer可以使一個經過訓練的模型來閱讀一個句子或段落,注意這些詞之間的關係,然後預測它認為接下來會出現什麼詞--類似前面提到的智能手機預測性文字的功能。
這裡就不展開討論了,但你需要知道的是,這意味著在其核心部分,Bard和ChatGPT彼此之間沒有太大區別。
ChatGPT與Google Bard:所有權
雖然所有權並不完全是一個技術上的差異,但它是值得記住的。
Google Bard是由Google製作並完全擁有的,在LaMDA之上,LaMDA也是由Google創建的。
ChatGPT是由OpenAI開發的,這是一家位於舊金山的人工智慧研究實驗室。 OpenAI最初是非營利性的,但它在2019年創建了一個營利性的子公司。 OpenAI也是Dall-E的幕後推手,你可能玩過的人工智慧文字到圖像的生成。
雖然微軟在OpenAI上投入了大量資金,但就目前而言,它是一個獨立的研究機構。
ChatGPT和Google Bard哪個好?
這個問題很難給出公平的回答,因為兩者相似的地方很多,但也有不同的地方。首先,現在幾乎沒有人可以訪問Google Bard。另外,ChatGPT的訓練資料幾乎在兩年前就被切斷了。
兩者都是文字產生器--你提供一個提示,Google Bard和ChatGPT都能回答。兩者都有數十億的參數來微調模型。兩者都有重疊的訓練資料來源,並且都建立在Transformer上,即同一個神經網路模型。
它們的設計目的也不同,Bard將幫助你瀏覽谷歌搜索,它被設計為對話式的。 ChatGPT可以產生整個部落格文章。它的設計是為了輸出有意義的文字。
即便說了ChatGPT和Google Bard之間的差異,那也只能證明人工智慧驅動的文字產生技術已經取得了多大進展。雖然它們都有一段路要走,而且都面臨著版權和道德方面的爭議,但這兩個生成器都是現代人工智慧模型發展的有力證明。
譯者介紹
崔皓,51CTO社群編輯,資深架構師,擁有18年的軟體開發與架構經驗,10年分散式架構經驗。
原文標題:,作者:Nate Rosidi
#
以上是ChatGPT與Google Bard:孰優孰劣,差異大盤點!的詳細內容。更多資訊請關注PHP中文網其他相關文章!