首頁 科技週邊 人工智慧 Google PaLM 2訓練所用文字資料量是初代的近5倍

Google PaLM 2訓練所用文字資料量是初代的近5倍

May 21, 2023 pm 06:49 PM
Google palm 2

谷歌 PaLM 2训练所用文本数据量是初代的近5倍

5月17日訊息,Google上週在2023年I/O開發者大會上推出最新大型語言模式PaLM 2。公司內部文件顯示,2022年起訓練新模型所使用的文字資料量幾乎是前一代的5倍。

據悉,Google最新發布的PaLM 2能夠執行更高階的程式設計、運算和創意寫作任務。內部文件透露,用於訓練PaLM 2的token數量有3.6兆個。

所謂的token就是字串,人們會將訓練模型所用文字中的句子、段落進行切分,其中的每個字串通常被稱為token。這是訓練大型語言模型的重要組成部分,能教導模型預測序列中接下來會出現哪個單字。

Google於2022年發布的上一代大型語言模型PaLM在訓練中使用了7800億個token。

儘管Google一直熱衷於展示其在人工智慧技術領域的實力,說明如何將人工智慧嵌入到搜尋引擎、電子郵件、文字處理和電子表格中,但一直不願公佈訓練資料的規模或其他細節。微軟支援的OpenAI也對最新發表的GPT-4大型語言模型細節保密。

兩家公司都表示,不透露這些資訊的原因是人工智慧產業存在激烈競爭。 Google和OpenAI都想要吸引那些希望使用聊天機器人而不是傳統搜尋引擎搜尋資訊的用戶。

但隨著人工智慧領域競爭的白熱化,研究界要求提高透明度。

自從推出PaLM 2以來,Google一直表示,新模型比之前的大型語言模型更小,這意味著該公司技術在完成更複雜任務時能變得更有效率。參數(parameters)通常用於說明語言模型的複雜性。根據內部文件,PaLM 2接受了3,400億個參數的訓練,初代的PaLM接受了5,400億個參數的訓練。

Google沒有立即發表評論。

Google在一篇關於PaLM 2的部落格文章中表示,新模型使用了一種名為“計算最優縮放”(compute-optimal scaling)的“新技術”,能使得PaLM 2“更有效率,整體效能更好,例如推理更快、服務參數更少,服務成本也更低。」

在發布PaLM 2時,Google透露新模型接受了100種語言的訓練,並能勝任各種各樣的任務。包括Google試驗性聊天機器人Bard在內的25項功能和產品用的都是PaLM 2。 PaLM 2依參數規模有四個不同的版本,從小到大依序是Gecko(壁虎)、Otter(水獺)、Bison(野牛)和Unicorn(獨角獸)。

根據Google公開披露的信息,PaLM 2比任何現有模型都更強大。 Facebook在今年2月宣布推出名為LLaMA的大型語言模型,在訓練中使用了1.4兆個token。 OpenAI在發布GPT-3時披露了相關訓練規模,當時公司表示,這個模型接受了3000億個token的訓練。今年3月份,OpenAI發布新模型GPT-4,並表示在許多專業測試中表現出「人類水平」。

根據最新文件,Google兩年前推出的語言模型接受了1.5兆個token的訓練。

隨著新的生成式人工智慧應用迅速成為科技業主流,圍繞底層技術的爭議也越來越激烈。

今年2月份,Google研究部門高級科學家埃爾·馬赫迪·埃爾·馬哈迪(El Mahdi El Mhamdi)因公司缺乏透明度而辭職。週二,OpenAI執行長薩姆·奧爾特曼(Sam Altman)在美國參議院司法小組委員會關於隱私和技術的聽證會上出庭作證,也同意用新系統來應對人工智慧。

「對於一項非常新的技術,我們需要一個新的框架,」奧爾特曼說,「當然,像我們這種公司對自己推出的工具負有很大責任。」

以上是Google PaLM 2訓練所用文字資料量是初代的近5倍的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解鎖Myrise中的所有內容
3 週前 By 尊渡假赌尊渡假赌尊渡假赌

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

deepseek怎麼評論 deepseek怎麼評論 Feb 19, 2025 pm 05:42 PM

DeepSeek是一款功能強大的信息檢索工具,其優勢在於能夠深入挖掘信息,但缺點是速度較慢、結果呈現方式較簡單且數據庫覆蓋範圍有限,需要根據具體需求權衡其利弊。

deepseek怎麼搜索 deepseek怎麼搜索 Feb 19, 2025 pm 05:39 PM

DeepSeek是一個專有搜索引擎,僅在特定數據庫或系統中搜索,速度更快,準確性更高。使用時,建議用戶閱讀文檔、嘗試不同的搜索策略、尋求幫助和反饋使用體驗,以便充分利用其優勢。

芝麻開門交易所網頁註冊鏈接 gate交易app註冊網址最新 芝麻開門交易所網頁註冊鏈接 gate交易app註冊網址最新 Feb 28, 2025 am 11:06 AM

本文詳細介紹了芝麻開門交易所(Gate.io)網頁版和Gate交易App的註冊流程。 無論是網頁註冊還是App註冊,都需要訪問官方網站或應用商店下載正版App,然後填寫用戶名、密碼、郵箱和手機號等信息,並完成郵箱或手機驗證。

Bybit交易所鏈接為什麼不能直接下載安裝? Bybit交易所鏈接為什麼不能直接下載安裝? Feb 21, 2025 pm 10:57 PM

為什麼Bybit交易所鏈接無法直接下載安裝? Bybit是一個加密貨幣交易所,為用戶提供交易服務。該交易所的移動應用程序不能直接通過AppStore或GooglePlay下載,原因如下:1.應用商店政策限制蘋果公司和谷歌公司對應用商店中允許的應用程序類型有嚴格的要求。加密貨幣交易所應用程序通常不符合這些要求,因為它們涉及金融服務,需要遵循特定的法規和安全標準。 2.法律法規合規在許多國家/地區,與加密貨幣交易相關的活動都受到監管或限制。為了遵守這些規定,Bybit應用程序只能通過官方網站或其他授權渠

芝麻開門交易平台下載手機版 gateio交易平台下載地址 芝麻開門交易平台下載手機版 gateio交易平台下載地址 Feb 28, 2025 am 10:51 AM

選擇正規渠道下載App,保障您的賬戶安全至關重要。

gate.io交易所官方註冊入口 gate.io交易所官方註冊入口 Feb 20, 2025 pm 04:27 PM

Gate.io 是一個領先的加密貨幣交易所,提供廣泛的加密資產和交易對。註冊 Gate.io 非常簡單,只需訪問其官方網站或下載 app,點擊“註冊”,填寫註冊表,驗證郵箱,設置雙重驗證(2FA),即可完成註冊。通過 Gate.io,用戶可以享受安全、便捷的加密貨幣交易體驗。

幣安binance官網最新版登錄入口 幣安binance官網最新版登錄入口 Feb 21, 2025 pm 05:42 PM

訪問幣安官方網站最新版登錄入口,只需遵循這些簡單步驟。前往官方網址,點擊右上角的“登錄”按鈕。選擇您現有的登錄方式,如果是新用戶,請“註冊”。輸入您的註冊手機號或郵箱和密碼,並完成身份驗證(例如手機驗證碼或谷歌身份驗證器)。成功驗證後,即可訪問幣安官方網站的最新版登錄入口。

芝麻開門交易所網頁版登入口 最新版gateio官網入口 芝麻開門交易所網頁版登入口 最新版gateio官網入口 Mar 04, 2025 pm 11:48 PM

詳細介紹芝麻開門交易所網頁版登入口操作,含登錄步驟、找回密碼流程,還針對登錄失敗、無法打開頁面、收不到驗證碼等常見問題提供解決方法,助你順利登錄平台。

See all articles