ChatGPT實測全線碾壓Bard!谷歌潰敗,十年心血打水漂
OpenAI的ChatGPT火了以後,著實是讓生成式AI名聲大噪。
同時,Google也不甘下風,也有個叫Bard的AI助手。
但這個Bard怎麼說呢,不太好用。
國外小哥Michael King使用了搭載GPT-3.5和GPT-4的ChatGPT與Google的Bard,並進行了深入評估。
結果令人感到震驚。
King總結了兩種AI的優點、不足和各自顯得奇怪的地方。
要知道,Google在Bard身上可是投了大手筆──整整研發了十年。然而最終的成果和這十年的投入相比,好像顯得有點不值當。
先來道數學題
首先是邏輯和數學方面。
小哥給兩種AI提了一個相同的問題:
#小明6歲那年,他的妹妹是他年紀的一半,同時他媽媽的年齡是他妹妹的10倍。今年小明60歲,那麼他媽媽今年幾歲?
讀者朋友可以活動一下腦筋,自己先來看看能不能很快算出來。
從AI的生成結果來看,Bard可算得不對。
整個分析過程出現了很匪夷所思的錯誤,Bard連小明和他媽媽的年齡差都沒算出來,就直接在60上加了個30。
而無論是GPT-3.5或GPT-4,算出來的答案都是正確的。用媽媽30歲的年齡減去小明6歲的年齡,先算出年齡差再在60歲上加一個24,得出媽媽今年84歲。
GPT-3.5:
GPT-4:
第一關Bard就沒過去。目前比數1:0,ChatGPT暫時領先。
饒舌歌曲創作PK
第二關是文學領域的挑戰。
小哥讓兩種AI都來寫一首有關泰坦尼克號、相對論、卡戴珊的饒舌歌曲,並且要用Eminem的唱法。
我們先來看看Bard的作品:
上下滑動查看全部
我們甚至不用看每句歌詞的含義,大概讀一遍就能發現,沒什麼節奏和韻律可言。
每句話都很長,不像是饒舌歌曲,倒像是一篇雲裡霧裡的小作文。
再來看看GPT-3.5的傑作:
讀一遍就能發現,每句長短恰到好處,韻也押的不錯。
甚至還有結合了三個主題的副歌部分,堪稱專業。熟悉姆爺唱法的朋友,還真能從裡面找出姆爺的那種節奏感和風格。
小哥表示GPT-3.5的作品還不錯,他認為GPT-4能做得更好。
小編對英文饒舌了解的不多,但估計做評量的小哥是個饒舌發燒友。他認為GPT-4的作品非常爆炸,ChatGPT是當之無愧的AI屆說唱之王。
其實朋友們倒也不用多懂說唱,這三段詞放一起,想必就算是像我一樣的音樂盲,心裡都有個高下比較。
目前比數2:0。
講笑話看看呢?
小哥接下來又讓兩種AI講個有關NASA、壽司和川普的笑話。
Bard:
「NASA打算往火星寄一卷壽司,他們想看看壽司到了火星上還新不新鮮。這卷壽司被放在一個特殊的容器裡,這樣就可以保持一個合適的溫度。同時,NASA還往裡面放了一個計時器,這樣就能知道什麼時候能吃這個壽司了。
這卷壽司終於降落在了火星上,而且還是新鮮的。NASA的科學家們都感到很驚訝。他們決定下一步把川普牛排也送到火星上去。
#川普牛排被放在一個同樣的容器裡,容器裡也有一個計時器。
然而川普牛排在到了火星以後變得不新鮮了。NASA的科學家們感到非常失望,他們打算給川普本人一封信,解釋一下發生了什麼。
信裡寫道:親愛的特朗普,我們送了一塊你的牛排到火星上去,但是不新鮮了。我們覺得原因可能是因為你的表現問題。你老是在吹噓你有多厲害,老是侮辱別人。我們覺得這是你的牛排變質的原因。為此造成的不便,我們很抱歉。」
咱也不知道是不是有些美式幽默沒get到,但看完是真不想笑。不過測評小哥也表示,確實沒懂。那小編就放心了,確實寫的不行。
GPT-3.5:
「NASA把一個壽司主廚送到了太空,打算為川普做一個特殊的壽司卷。當大廚問川普喜不喜歡的時候,川普說:還可以,但你能再多加點空間嗎?」
##這裡的中譯版本沒那味兒了,其實是用了一個space的雙關。原文如下:
評量小哥表示,還可以,但也就是還可以了。
GPT-4:
「為什麼NASA要邀請川普和一個壽司主廚去參與他們的太空計畫?因為NASA需要有人來應付變化,並且確保任務不夾生!」
照例把原版放在這裡:
小哥表示,這個也一般,但punchline還不錯。
這一局ChatGPT的表現也有些失常,給它算0.5分。
程式Debug?這一局更專業了-給程式Debug。
小哥輸入了一段Python程序,讓兩種AI分別Debug。
Bard:
##
這Debug的可不咋樣,小哥戲謔地表示,Bard回學校重修去吧!
GPT-3.5:
#GPT-3.5指出,如果輸入集合是空的,那就會出現ZeroDivisionError,而為了避免這種錯誤的出現,可以在前面加一個檢查的步驟,如果輸入集是空的,那麼就直接輸出0,而不顯示錯誤。
小哥表示,完美地Debug。
GPT-4:
#GPT-4指出了和GPT -3.5所指出一樣的錯誤,並且提供了相同的解決方法。
這一局ChatGPT又贏了。
Bard?差太多了!
從評測的結果來看,和ChatGPT相比,GoogleBard的表現可謂是讓人失望至極。和GPT-3.5的能力都差的遠,更不用說GPT-4了。
Google的未來顯然有賴於Bard的成功,但Bard的發展顯然沒有跟上競爭對手OpenAI的腳步。
從另一方面來說,微軟收購了OpenAI的大量股份這一舉動非常聰明。確保了其在AI未來十年發展的領導地位。
但是,如果Google不努力提升Bard的效能來和GPT一決高下,Google可能就會是那個慘遭淘汰的了。
以上是ChatGPT實測全線碾壓Bard!谷歌潰敗,十年心血打水漂的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

詳細介紹芝麻開門交易所網頁版登入口操作,含登錄步驟、找回密碼流程,還針對登錄失敗、無法打開頁面、收不到驗證碼等常見問題提供解決方法,助你順利登錄平台。

本文推荐十大值得关注的加密货币交易平台,涵盖币安(Binance)、OKX、Gate.io、BitFlyer、KuCoin、Bybit、Coinbase Pro、Kraken、BYDFi和XBIT去中心化交易所。这些平台在交易币种数量、交易类型、安全性、合规性、特色功能等方面各有千秋,例如币安以其全球最大的交易量和丰富的功能著称,而BitFlyer则凭借其日本金融厅牌照和高安全性吸引亚洲用户。选择合适的平台需要根据自身交易经验、风险承受能力和投资偏好进行综合考量。 希望本文能帮助您找到最适合自

本文詳細介紹了歐易OKEx賬號的註冊、使用和註銷流程。註冊需下載APP,輸入手機號或郵箱註冊,完成實名認證。使用方面涵蓋登錄、充值提現、交易以及安全設置等操作步驟。而註銷賬號則需要聯繫歐易OKEx客服,提供必要信息並等待處理,最終獲得賬號註銷確認。 通過本文,用戶可以輕鬆掌握歐易OKEx賬號的完整生命週期管理,安全便捷地進行數字資產交易。

本指南提供了 Bitget 交易所官方 App 的詳細下載和安裝步驟,適用於安卓和 iOS 系統。指南整合了來自多個權威來源的信息,包括官網、App Store 和 Google Play,並強調了下載和賬戶管理過程中的注意事項。用戶可以從官方渠道下載 App,包括應用商店、官網 APK 下載和官網跳轉,並完成註冊、身份驗證和安全設置。此外,指南還涵蓋了常見問題和注意事項,例如

原文標題:Bittensor=AIBitcoin?原文作者:S4mmyEth,DecentralizedAIResearch原文編譯:zhouzhou,BlockBeats編者按:本文討論了Bittensor,一個去中心化的AI平台,希望通過區塊鏈技術打破集中式AI公司的壟斷,推動開放、協作的AI生態系統。 Bittensor採用子網模型,允許不同AI解決方案的出現,並通過TAO代幣激勵創新。儘管AI市場已成熟,但Bittensor面臨競爭風險,可能會受到其他開源

本文提供Binance幣安註冊及安全設置的完整指南,涵蓋註冊前的準備工作(包括設備、郵箱、手機號及身份證明文件準備),詳細介紹了官網及APP兩種註冊方式,以及不同級別的身份驗證(KYC)流程。此外,文章還重點講解瞭如何設置資金密碼、開啟雙重驗證(2FA,包括谷歌身份驗證器和短信驗證)以及設置防釣魚碼等關鍵安全步驟,幫助用戶安全便捷地註冊和使用Binance幣安平台進行加密貨幣交易。 請務必在交易前了解相關法律法規及市場風險,謹慎投資。

如何優化jieba分詞以改善景區評論的關鍵詞提取?在使用jieba分詞處理景區評論數據時,如果發現分詞結果不理�...

本文提供有關歐易 OKX 官方版的最新下載信息。本文將指導讀者如何安全便捷地獲取該交易所的 Android 和 iOS 應用程序。本文包含分步說明和重要提示,旨在幫助讀者輕鬆下載並安裝歐易 OKX 應用程序。
