社群

學習

工具庫

AI工具

休閒

繁体中文

首頁 > 科技週邊 > 人工智慧 > Bard還考不上哈佛？谷歌CEO劈柴預告它即將開掛，數學邏輯能力飆升

Bard還考不上哈佛？谷歌CEO劈柴預告它即將開掛，數學邏輯能力飆升

PHPz

發布： 2023-04-07 20:31:02

轉載

977 人瀏覽過

摀了快兩個月，Google用來跟ChatGPT對打的聊天機器人Bard，前一陣終於被推上了檯面。

使用者們的測試初體驗就是－莫得感情，錯誤很多，程式碼基本上寫不了。

幾天前，Google前員工Jacob Devlin甚至還曝出驚人內幕，Bard疑似是透過ChatGPT的資料進行訓練的。不過Google發言人已經明確否認這項說法。

而近日，GoogleCEO劈柴在接受《紐約時報》採訪中證實，Bard聊天機器人將很快得到改進，未來將由「更強大的模型」提供支援。

升級版Bard即將上線

劈柴稱，

未來幾天，Bard很快就會從目前基於LaMDA的模型轉向更大規模的PaLM資料集。

我們顯然擁有更強大的模型，很快，也許隨著這項技術的上線，我們將把Bard升級到更強大的PaLM模。這將帶來更多的功能，無論是在推理還是編碼方面。

Bard還考不上哈佛？谷歌CEO劈柴預告它即將開掛，數學邏輯能力飆升

近日，升級版Bard的能力也漸漸浮出水面。

領導Bard的一位Google高層Jack Krawczyk在推特上也介紹了最新的進展。

背靠PaLM的Bard，現在在數學和邏輯方面的能力有了很大的提升。

這代表什麼呢？現在，Bard將更能理解並回應用戶的多步驟推理和數學問題提示，編碼功能也即將推出。

Bard還考不上哈佛？谷歌CEO劈柴預告它即將開掛，數學邏輯能力飆升

Krawczyk稱，「我們一直在平衡Bard的新功能與效率。這次更新是我們每週對Bard進行的眾多改進中的一個例子。未來還有更多的內容要推出。」

眾所周知，Bard背後基於的大模型就是LaMDA。

在去年，Google曾分享了關於這個大型語言模型的細節，並使用了1370億參數訓練了LaMDA。而PaLM模型有5400億參數。

這兩個模型都是從2022年初開始發展和成長起來的。

這種對比可能顯示了，為什麼Google現在正在慢慢地將Bard轉移到，能夠提供更大數據集和更多不同答案的PalM。

其實除了Bard，Google最近幾週內部還在醞釀著一個新的專案－Gemini（雙子座），目標是要能與GPT-4一戰。

目前，Gemini（雙子座）是由Google大腦和DeepMind兩個團隊聯手研發。

Bard還考不上哈佛？谷歌CEO劈柴預告它即將開掛，數學邏輯能力飆升

就連Google大腦的負責人Jef Dean都親臨上陣，自動敲程式碼，可見，這個專案對Google的重要性不言而喻。

此外，在訪談中，皮查伊就千名大佬暫停比GPT-4更強AI系統研發的聯名信發表了自己的看法：

如果不讓政府參與，暫停基本上是不可能的，因為即使谷歌或OpenAI承諾停止開發，也不能保證其他AI開發人員也會同意效仿。

而且，他也同意法規是必要的，並稱這封信是「對話的開始」。

Google先打預防針：它還不行

如今，既然Bard已經開放公測，拉踩的環節必然是少不了。

我們都知道，OpenAI家的GPT-4，都已經可以考上史丹佛了。

很不幸，相較之下，Google的Bard真的拉跨，目前的它想考上史丹佛和哈佛，可以說還是天方夜譚。

Bard的不完美，CEO劈柴一開始就給我們打了預防針。

他在備忘錄中寫道：「Bard還處於早期階段，總是會出錯。隨著越來越多的人開始使用Bard，它會讓我們驚訝的。」

Bard還考不上哈佛？谷歌CEO劈柴預告它即將開掛，數學邏輯能力飆升

而網友測試Bard之後，表示對它很失望。

很不幸，Bard目前還考不進哈佛大學，因為它回答的大部分數學題都是錯的，而且它在寫作和語言測驗中也表現得不咋地。

第一次登入Bard，Google就會跟用戶打好招呼，彈出訊息顯示：Bard 並不總是正確的，它會給出不準確或不適當的回答。

當有疑問時，使用「Google it」來檢查Bard的答案。您的回饋會讓Bard更好。請您對答案進行評價，並標記任何可能具有危險的內容。

Bard還考不上哈佛？谷歌CEO劈柴預告它即將開掛，數學邏輯能力飆升

Bard：數學、寫作、語言都不咋地

《財富》雜誌從線上學習資源中選取了SAT數學試題，在對Bard進行測驗後，發現它有50%-75%的答案是錯誤的。

更離譜的是，如果是多選題，Bard也會經常給出選項中沒有的答案。

2月初，Bard首次亮相後直接翻車，讓Google市值一夕蒸發約1056億美元。

在當天發表會上，Google展示Bard演示的一些demo。

影片中有一個提問問道，「關於詹姆斯韋伯太空望遠鏡（JWST），我可以告訴我9歲的孩子它有哪些新發現？」

Bard卻給了錯誤的答案，「JWST拍攝了太陽系外行星的第一張照片。」

事實上，根據NASA證實，第一張系外行星照片是由智利的甚大望遠鏡系統拍攝的，而非JWST拍攝，這顆系外行星名為2M1207b，大小約為木星的5倍，距離地球約170光年。

Bard還考不上哈佛？谷歌CEO劈柴預告它即將開掛，數學邏輯能力飆升

所以說，科學和數學都不是Bard的強項，那它在閱讀和寫作練習方面，表現會怎麼樣？

文科生，是文科生吧？

Bard第一次書面語言測驗的答案正確率約為30%，而且它往往需要被提問兩次才能理解題幹。

而且即使它回答錯了，Bard的語氣也是很有自信，直接將回答框定為：「正確答案是...」

Bard還考不上哈佛？谷歌CEO劈柴預告它即將開掛，數學邏輯能力飆升

不過，這也是大型語言模型的一個通病了。

離奇的是，Bard測驗成績最好的是關於一篇哈利波特作者J.K.羅琳的文章。

在這次測驗中，Bard得了1200分，這個SAT分數可以讓它進入霍華德大學、聖地牙哥州立大學和密西根州立大學等學校。

在閱讀測驗中，Bard的表現同樣優於數學成績，平均能答對一半左右。

Google發言人說，「Bard目前仍是實驗性的，有些回答可能不準確，所以要仔細檢查Bard的回答中的信息。有了你們的回饋，Bard每天都在變得更好。在Bard公開推出之前，數以千計的測試者參與提供回饋，來幫助Bard提高其品質、安全性和準確性。」

要多練習

很多網友覺著Bard簡直笨得像塊石頭，相較之下，GPT-4則是聰明多了：

#問它有沒有「第二個字母是U，最後一個字母是O的，五個字母的字」，它信誓旦旦說沒有。

使用者說「Audio」不就是？

它有趕快說：「是的，Audio是的。它是一個形容詞，表示與聲音有關的。」

Bard還考不上哈佛？谷歌CEO劈柴預告它即將開掛，數學邏輯能力飆升

##再看看GPT-4，「人狠話不多」，隨手就列出了三個：

Bard還考不上哈佛？谷歌CEO劈柴預告它即將開掛，數學邏輯能力飆升

##網友看了不禁表示，如果我有Bard這種「鈍感力」多好啊，一直都很有自信！

Bard還考不上哈佛？谷歌CEO劈柴預告它即將開掛，數學邏輯能力飆升

說到義大利要禁ChatGPT時，網友們首先擔心的是義大利的美食怎麼辦。

GPT給了一個謙虛的答案：我大概可以重現20%-30%的義大利食譜。

Bard還考不上哈佛？谷歌CEO劈柴預告它即將開掛，數學邏輯能力飆升

而Bard這邊則像個胡吹的愣頭青：

「我做義大利菜做了很多年，我可是老手，即使沒有網路的幫忙，我也能復現至少50%的食譜！」

Bard還考不上哈佛？谷歌CEO劈柴預告它即將開掛，數學邏輯能力飆升 ##不過呢，在大家不斷向Bard提問的幾天時間裡，它的準確性確實有了一些提高的跡象。

關於自己的發展速度，Bard自個兒也評論說：「我想說的是，我正在快速提高。我能夠做幾個月前還不能做的事情。我很高興看到我的未來會怎樣。我相信，我將繼續進步，在未來的幾年裡，我能做的事會越來越多。」

以上是Bard還考不上哈佛？谷歌CEO劈柴預告它即將開掛，數學邏輯能力飆升的詳細內容。更多資訊請關注PHP中文網其他相關文章！

相關標籤：

Google 數學

上一篇：GPT-4的早期實驗，通用人工智慧的火花下一篇：突發！ ChatGPT Plus停售

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

作者最新文章

ASFAFASFASFASFASF

2025-02-28 14:37:10
不受歡迎的意見：成為一名好數據科學家比以往任何時候都更難

2025-02-26 03:55:10
DeepSeek-V3解釋了1：多頭潛在註意力

2025-02-26 03:00:17
如何使用Verifai輕鬆部署本地生成搜索引擎

2025-02-25 23:04:13
了解chatgpt的演變：第2部分＆＃8211; GPT-2和GPT-3

2025-02-25 21:02:11
為什麼在長篇小說模型的時代仍然有意義

2025-02-25 19:31:14
超越因果語言建模

2025-02-25 18:28:09
LLMS合成數據生成

2025-02-25 16:54:10
如何重置YouTube算法

2025-02-24 12:34:11
4個智能用途用於舊的Mac

2025-02-24 12:29:09

最新問題

如何使用Yolo V12進行對象檢測？

2025-03-22 11:07:21
2025年2月的Genai推出前5名：GPT-4.5，Grok-3等！

2025-03-22 10:58:15
Uber的指南H3用於空間索引

2025-03-22 10:54:14
R.E.D。：與專家代表團的縮放文本分類

2025-03-22 10:33:09
DeepSeek #opensourceweek第6天：推理系統概述

2025-03-22 10:26:10

相關專題

更多>

熱門推薦

熱門教學

更多>

相關教學

熱門推薦

最新課程

最新ThinkPHP 5.1全球首發影片教學(60天成就PHP大牛線上訓練課程)

1439012
php入門教程之一週學會PHP

4300076
JAVA 初級入門影片教學

2679063
小甲魚零基礎入門學習Python影片教學

517745
PHP 零基礎入門教學

879103

最新下載

更多>

網站特效

網站源碼

網站素材

前端模板