首頁 > 科技週邊 > 人工智慧 > ChatGPT與Google Bard:孰優孰劣,差異大盤點!

ChatGPT與Google Bard:孰優孰劣,差異大盤點!

PHPz
發布: 2023-03-31 22:39:06
轉載
1217 人瀏覽過

AIGC 產業最大的兩個競爭對手:ChatGPT vs Google Bard! 本文介紹這兩個人工智慧引擎之間的技術差異。

譯者| 崔皓

審校| 孫淑娟

#開篇

AIGC 業界最大的兩個競爭對手:ChatGPT vs Google Bard! 本文介紹這兩個人工智慧引擎之間的技術差異。

ChatGPT與Google Bard:孰優孰劣,差異大盤點!

截至目前Google Bard和ChatGPT之間最大的差異是:Bar​​d知道ChatGPT,但ChatGPT對Bard懵然不知。雖然我們可以玩轉ChatGPT,而Bard對我們大多數人來說仍然遙不可及。

ChatGPT與Google Bard:孰優孰劣,差異大盤點!

ChatGPT與Google Bard之戰的開始

ChatGPT和Google Bard都是人工智慧聊天機器人。人工智慧的簡易版本已經可以在手機上使用了,當你輸入 "good"時,手機就可以預測下一個字是 "morning"。

ChatGPT最初是由OpenAI開發的,然後由微軟以令人瞠目結舌的100億美元(除了早先的10億美元投資外)進行投資。谷歌方面,對他們的搜尋壟斷可能要結束而略感恐慌,因此推出了Bard,但這個版本仍然存在一些缺陷。在第一次現場演示中,Bard犯了幾個事實性錯誤,讓Google感到很尷尬。

ChatGPT和Google Bard比智慧型手機的預測文字功能更複雜,如果說要了解這兩款智慧機器人之間的差異,下面的內容你就不能錯過了。

這裡我們會深入描述兩個人工智慧引擎之間的技術差異。

ChatGPT與Bard:內藏玄機?

我們可以透過以下表格快速了解它們之間的技術差異,透過表格可以看到很多細節。

##LaMDA,即對話應用的語言模型神經網路結構 ##

透過上面的表格了解了兩者之間的差異,接下來讓我們深入了解其他指標。

什麼是ChatGPT?

ChatGPT於2022年11月30日突然出現在舞台上。到2022年12月4日,該服務每天有超過一百萬的用戶。 2023年1月,這個數字膨脹到1億多用戶。

它突然這麼受歡迎其基本原因是,它能以一種聽起來幾乎是人類的方式,為你提供許多主題的可靠回答,而且任何能夠上網的人都可以使用它。

ChatGPT是OpenAI創建的,OpenAI是一家位於舊金山的人工智慧實驗室,專注於創造友善的人工智慧方案。該聊天機器人是基於GPT-3.5開發的,GPT-3.5是一個大型語言模型,當給定文字時,可以持續給請求者回應。

ChatGPT在此基礎上增加了一些額外的訓練--人類培訓師透過與模型的互動改進了模型,並透過"獎勵 "的方式讓模型具備提供高品質答案的能力。

訓練資料

GPT-3.5是在一個巨大的網路文字資料集上訓練的,包括一個叫做Common Crawl的流行資料集。 Common Crawl包含PB級的網路數據,包括原始網頁資料、元資料擷取和文字擷取。例如,它包括來自StrataScratch的URLs集合。想想ChatGPT使用訓練的資料來自網友在ChatGPT的輸入,這是不是很瘋狂?

Common Crawl負責60%的訓練數據,但GPT-3.5也有其他數據來源。

ChatGPT與Google Bard:孰優孰劣,差異大盤點!

什麼是Google Bard?

Google Bard 是在ChatGPT大受追捧的情況下,由Google推出的智慧聊天機器人。與ChatGPT不同,Bard是由Google自己的模型LaMDA驅動。 LaMDA是對話應用語言模型的簡稱,與ChatGPT不同的是,它沒有那麼驚艷,原因很簡單,大多數人還不能訪問它。儘管Google在2月初​​確實搞了一個充滿尷尬的Bard演示,但目前Bard只對少數人開放。

Google Bard的主要優勢是它對網路開放。問ChatGPT“現在誰是總統?”,它是不知道的。這是因為訓練資料在2021年中期左右被切斷了。而Bard則是藉鏡了今天網路上的資訊。從理論上講,Bard應該能夠從今天互聯網上的數據中提取,告訴你現在誰是總統。

很容易看出Bard在幾個關鍵方面是如何從ChatGPT中脫穎而出的。

ChatGPT與Google Bard:孰優孰劣,差異大盤點!

訓練資料

首先,LaMDA是在對話中訓練的,專門用於對話,而不是像GPT-n模型那樣只產生文本。雖然ChatGPT對其訓練資料不加掩飾,但我們對Bard所訓練的資料還不甚了解,可以透過查看LaMDA的研究論文來推論。谷歌的研究人員說,12.5%的訓練資料來自Common Crawl,例如GPT-n模型。另外12.5%來自維基百科。而根據研究論文,他們使用了1.56兆字的 "公共對話資料和網路文本"。

以下是完整的分類:

  • 12.5%基於C4的資料(Common Crawl資料的衍生性商品)。
  • 12.5%的英文維基百科
  • 12.5%來自程式問答網站、教學課程和其他的程式碼文件
  • 6.25%的英文網頁文件
  • 6.25%的非英語網路文件
  • 50%來自公共論壇的對話數據

從上面的資訊可以知道兩者共同利用的數據,顯然有維基百科。其餘的數據明顯是Google故意隱藏的,大概是為了保護Bard(和LaMDA)不被模仿。

LaMDA是透過微調Transformer的神經語言模型而形成的,它是一個最初由Google開發的開源神經網路架構。 (GPT也是建立在Transformer的基礎上)。

ChatGPT與Google Bard:孰優孰劣,差異大盤點!

ChatGPT存在一些壁壘,以防止它讓人生厭或說一些廢話,但谷歌強調如何保證質量,以使Bard變成更好、更安全的聊天機器人。 Bard經過微調,變得"高品質、接地氣和安全"。

Google對此有很多說法,我建議閱讀他們的相關博文,但如果你時間不多,基本上可以分成以下幾個方面:

  • Bard應該給予有意義的回應--沒有荒謬的內容,沒有矛盾的內容
  • Bard應作出有見地、詼諧或出人意料的回應。
  • Bard應該避免任何有可能對使用者造成傷害的東西--血腥、偏見、可憎的刻板印像等
  • Bard不胡編亂造

眾所周知,由於一次錯誤的發布,谷歌還沒有完全弄清楚底層需求。但值得注意的是,Google對設計要求說得很清楚,而ChatGPT沒有說的那麼清楚--至少目前是這樣。

ChatGPT與Google Bard比較:模型參數為什麼很重要?

ChatGPT確實比Bard擁有更多的模型參數--1750億對1370億。你可以把參數看成是模型調整的旋鈕或槓桿,以適應它所訓練的資料。更多的參數通常意味著模型有更多的能力來捕捉語言中的複雜關係,但也有過度擬合的風險。與ChatGPT相比,Google Bard可能不那麼靈活,但也可能因為新的語言用例使其更加強大。

ChatGPT與Google Bard:共同點?

值得強調的是,Bard和ChatGPT的模型(分別是LaMDA和GPT-3.5)都位於基於Transformer的深度學習神經網路。

例如,Transformer可以使一個經過訓練的模型來閱讀一個句子或段落,注意這些詞之間的關係,然後預測它認為接下來會出現什麼詞--類似前面提到的智能手機預測性文字的功能。

這裡就不展開討論了,但你需要知道的是,這意味著在其核心部分,Bard和ChatGPT彼此之間沒有太大區別。

ChatGPT與Google Bard:所有權

雖然所有權並不完全是一個技術上的差異,但它是值得記住的。

Google Bard是由Google製作並完全擁有的,在LaMDA之上,LaMDA也是由Google創建的。

ChatGPT是由OpenAI開發的,這是一家位於舊金山的人工智慧研究實驗室。 OpenAI最初是非營利性的,但它在2019年創建了一個營利性的子公司。 OpenAI也是Dall-E的幕後推手,你可能玩過的人工智慧文字到圖像的生成。

雖然微軟在OpenAI上投入了大量資金,但就目前而言,它是一個獨立的研究機構。

ChatGPT和Google Bard哪個好?

這個問題很難給出公平的回答,因為兩者相似的地方很多,但也有不同的地方。首先,現在幾乎沒有人可以訪問Google Bard。另外,ChatGPT的訓練資料幾乎在兩年前就被切斷了。

兩者都是文字產生器--你提供一個提示,Google Bard和ChatGPT都能回答。兩者都有數十億的參數來微調模型。兩者都有重疊的訓練資料來源,並且都建立在Transformer上,即同一個神經網路模型。

它們的設計目的也不同,Bard將幫助你瀏覽谷歌搜索,它被設計為對話式的。 ChatGPT可以產生整個部落格文章。它的設計是為了輸出有意義的文字。

即便說了ChatGPT和Google Bard之間的差異,那也只能證明人工智慧驅動的文字產生技術已經取得了多大進展。雖然它們都有一段路要走,而且都面臨著版權和道德方面的爭議,但這兩個生成器都是現代人工智慧模型發展的有力證明。

譯者介紹

崔皓,51CTO社群編輯,資深架構師,擁有18年的軟體開發與架構經驗,10年分散式架構經驗。

原文標題:,作者:Nate Rosidi

#


ChatGPT

#Bard

#模型

#GPT-3.5

###Transformer###

Transformer

訓練資料

網路文本,主要是被稱為"commoncrawl"的資料集,在2021年中期截止。

156萬字的公共對話資料和網路文字

目的

成為一個多用途的文本生成聊天機器人

專門協助搜尋

##參數

1750億參數

1370億參數

# #創建者

###OpenAI############Google###############################Google##################優勢############- 對所有人開放######- 更靈活,能夠處理開放式文字######- 訓練資料截止到2021年###

- 訓練資料截止到目前

- 專門為對話而訓練,所以當你和它對話的時候,聽起來更像人。

劣勢

- 對話沒有那麼有說服力

- 沒有那麼仔細的微調

- 目前還沒有

- 可能不那麼適合一般的文字創作

以上是ChatGPT與Google Bard:孰優孰劣,差異大盤點!的詳細內容。更多資訊請關注PHP中文網其他相關文章!

相關標籤:
來源:51cto.com
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
最新問題
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板