Google PaLM 2のトレーニングに使用されるテキストデータの量は、元の世代のほぼ5倍です-AI-php.cn

ホームページ

テクノロジー周辺機器

Google PaLM 2のトレーニングに使用されるテキストデータの量は、元の世代のほぼ5倍です

PHPz

May 21, 2023 pm 06:49 PM

グーグル palm 2

谷歌 PaLM 2训练所用文本数据量是初代的近5倍

5 月 17 日のニュースによると、Google は先週の 2023 I/O Developer Conference で最新の大規模言語モデル PaLM 2 を発表しました。社内文書によると、2022 年以降の新しいモデルのトレーニングに使用されるテキストデータの量は、前世代のほぼ 5 倍になっています。

Google が新たにリリースした PaLM 2 は、より高度なプログラミング、コンピューティング、クリエイティブライティングのタスクを実行できると報告されています。内部文書によると、PaLM 2 のトレーニングに使用されたトークンの数は 3 兆 6,000 億であることが明らかになりました。

いわゆるトークンは文字列です。モデルのトレーニングに使用されるテキスト内の文と段落をセグメント化します。各文字列は通常、トークンと呼ばれます。これは大規模な言語モデルをトレーニングする際の重要な部分であり、シーケンス内で次にどの単語が来るかを予測するように学習します。

Google が 2022 年にリリースした前世代の大規模言語モデル PaLM では、トレーニングに 7,800 億のトークンが使用されました。

Google は、人工知能テクノロジーを検索エンジン、電子メール、ワードプロセッサ、スプレッドシートにどのように組み込むことができるかを示し、人工知能テクノロジーにおける優れた能力を実証することに熱心でしたが、トレーニングデータの規模を公開することには消極的でした。その他の情報。 Microsoft が支援する OpenAI も、新しくリリースされた GPT-4 大規模言語モデルの詳細を秘密にしています。

両社は、この情報を開示しない理由は人工知能業界の熾烈な競争であると述べています。 Google と OpenAI はどちらも、情報を検索するために従来の検索エンジンの代わりにチャットボットを使用したいユーザーを引き付けたいと考えています。

しかし、人工知能分野での競争が激化するにつれ、研究コミュニティはさらなる透明性を求めています。

PaLM 2の発表以来、Googleは、新しいモデルは以前の大規模な言語モデルよりも小さい、つまり同社のテクノロジーはより複雑なタスクをより効率的に実行できると述べてきた。パラメーターは、言語モデルの複雑さを説明するためによく使用されます。内部文書によると、PaLM 2 は 3,400 億のパラメータでトレーニングされ、オリジナルの PaLM は 5,400 億のパラメータでトレーニングされました。

Googleからは現時点でコメントは得られていない。

PaLM 2に関するブログ投稿の中で、Googleは、新しいモデルは「コンピューティング最適化スケーリング」(コンピューティング最適化スケーリング)と呼ばれる「新技術」を使用しており、これによりPaLM 2の効率が向上すると述べた。推論の高速化、サービスパラメータの減少、サービスコストの削減など、全体的なパフォーマンスの向上。」

PaLM 2 をリリースする際、Google は、新しいモデルが 100 の言語でトレーニングされ、さまざまな機能を実行できることを明らかにしました。タスク。 PaLM 2 は、Google の実験的なチャットボット Bard を含む 25 の機能と製品で使用されています。 PaLM 2 には、パラメータースケールに応じて、小さいものから大きいものまで、Gecko、Otter、Bison、Unicorn の 4 つの異なるバージョンがあります。

Google が公開した情報によると、PaLM 2 は既存のどのモデルよりも強力です。 Facebookは今年2月、トレーニングに1兆4000億トークンを使用したLLaMAと呼ばれる大規模言語モデルの立ち上げを発表した。 OpenAI は GPT-3 のリリース時に関連するトレーニングスケールを明らかにし、その際、同社はモデルが 3,000 億トークンでトレーニングされたと述べました。今年3月、OpenAIは新モデルGPT-4をリリースし、多くの専門的なテストで「人間レベル」の性能を発揮したと発表した。

最新の文書によると、Google が 2 年前に発表した言語モデルは 1 兆 5,000 億のトークンでトレーニングされました。

新しい生成 AI アプリケーションがテクノロジー業界で急速に主流になるにつれて、基盤となるテクノロジーをめぐる論争はますます激化しています。

今年 2 月、Google の研究部門の上級科学者であるエル・マハディ・エル・マムディ氏は、同社の透明性の欠如を理由に辞任しました。 OpenAIの最高経営責任者（CEO）サム・アルトマン氏は火曜日、プライバシーとテクノロジーに関する米上院司法小委員会の公聴会で証言し、人工知能に対処するための新たなシステムに同意した。

「非常に新しいテクノロジーには、新しいフレームワークが必要です。もちろん、当社のような企業は、自社が提供するツールに対して多くの責任を負っています。」

以上がGoogle PaLM 2のトレーニングに使用されるテキストデータの量は、元の世代のほぼ5倍ですの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

神レベルのコード編集ソフト（SublimeText3）

ホットトピック

Java チュートリアル

1666

CakePHP チュートリアル

1425

Laravel チュートリアル

1327

PHP チュートリアル

1273

C# チュートリアル

1253

Related knowledge

Crypto Digital Asset Trading App（2025グローバルランキング）に推奨されるトップ10 Mar 18, 2025 pm 12:15 PM

この記事では、Binance、Okx、Gate.io、Bitflyer、Kucoin、Bybit、Coinbase Pro、Kraken、Bydfi、Xbit分散化された交換など、注意を払う価値のある上位10の暗号通貨取引プラットフォームを推奨しています。これらのプラットフォームには、トランザクションの数量、トランザクションの種類、セキュリティ、コンプライアンス、特別な機能の点で独自の利点があります。適切なプラットフォームを選択するには、あなた自身の取引体験、リスク許容度、投資の好みに基づいて包括的な検討が必要です。この記事があなたがあなた自身に最適なスーツを見つけるのに役立つことを願っています

OUYI OKEXアカウントを登録、使用、キャンセルする方法に関するチュートリアル Mar 31, 2025 pm 04:21 PM

この記事では、OUYI OKEXアカウントの登録、使用、キャンセル手順を詳細に紹介します。登録するには、アプリをダウンロードし、携帯電話番号または電子メールアドレスを入力して登録する必要があります。使用法は、ログイン、リチャージ、引き出し、取引、セキュリティ設定などの操作手順をカバーします。アカウントをキャンセルするには、OUYI Okexカスタマーサービスに連絡し、必要な情報を提供し、処理を待つ必要があり、最後にアカウントキャンセルの確認を取得する必要があります。この記事を通じて、ユーザーはOUYI OKEXアカウントの完全なライフサイクル管理を簡単に習得し、デジタルアセットトランザクションを安全かつ便利に実施できます。

Binanceの登録方法に関する詳細なチュートリアル（2025初心者ガイド） Mar 18, 2025 pm 01:57 PM

この記事では、ビナンスの登録とセキュリティ設定の完全なガイドを提供し、事前登録の準備（機器、電子メール、携帯電話番号、IDドキュメントの準備を含む）をカバーし、公式ウェブサイトとアプリに2つの登録方法、およびさまざまなレベルのID検証（KYC）プロセスを紹介します。さらに、この記事では、ファンドパスワードの設定、2要素検証（Google AuthenticatorおよびSMS検証を含む2FA）の有効化、アンチフィッシングコードのセットアップなどの主要なセキュリティ手順にも焦点を当て、ユーザーが暗号通貨トランザクションのBinance Binanceプラットフォームを安全かつ便利に登録および使用するのに役立ちます。取引する前に、関連する法律や規制、市場のリスクを必ず理解してください。

Jieba Wordセグメンテーションを最適化して、風光明媚なスポットコメントのキーワード抽出効果を改善する方法は？ Apr 01, 2025 pm 06:24 PM

Jieba Wordセグメンテーションを最適化して、風光明媚なスポットコメントのキーワード抽出を改善する方法は？ Jieba Wordセグメンテーションを使用して風光明媚なスポットコメントデータを処理する場合、単語セグメンテーションの結果が無視されている場合...

gate.ioモバイルアプリの使用に関するチュートリアル Mar 26, 2025 pm 05:15 PM

gate.ioモバイルアプリの使用に関するチュートリアル：1。Androidユーザーについては、公式gate.ioのWebサイトにアクセスしてAndroidインストールパッケージをダウンロードするには、携帯電話設定に不明なソースからアプリケーションをインストールできるようにする必要があります。 2。IOSユーザーの場合、App Storeで「gate.io」を検索してダウンロードします。

最古の仮想通貨のランキングに関する最新の更新 Apr 22, 2025 am 07:18 AM

仮想通貨の「最古」のランキングは次のとおりです。1。Bitcoin（BTC）は、2009年1月3日に発行され、最初の分散型デジタル通貨です。 2。2011年10月7日にリリースされたLitecoin（LTC）は、「ビットコインの軽量バージョン」として知られています。 3。2011年に発行されたRipple（XRP）は、国境を越えた支払い用に設計されています。 4。2013年12月6日に発行されたDogecoin（Doge）は、Litecoinコードに基づいた「Meme Coin」です。 5。2015年7月30日にリリースされたEthereum（ETH）は、スマートコントラクトをサポートする最初のプラットフォームです。 6。2014年に発行されたTether（USDT）は、米ドル1：1に固定された最初のスタブコインです。 7。アダ、

OKEXトレーディングプラットフォーム公式ウェブサイトログインポータル Mar 18, 2025 pm 12:42 PM

この記事では、準備作業（安定したネットワーク接続とブラウザの更新を確保するため）、公式ウェブサイトへのアクセス（URLの正確さに注意し、フィッシングWebサイトを避けるため）、ログインの入り口を見つけるために、「ログイン」ボタンの右上隅に入っていますセキュリティ検証（スライディング検証、Google検証、またはSMS検証）、そして最後に、ログインした後にデジタル資産取引を実施できます。ユーザー資産の安全性を確保するための安全で便利なログインプロセス。

安全で信頼性の高い仮想通貨購入アプリに推奨されるトップ10 Mar 18, 2025 pm 12:12 PM

2025年には、トップ10の推奨されるグローバルな仮想通貨取引プラットフォームで、デジタル通貨市場でのプレイを支援します。この記事では、Binance、Okx、Gate.io、Bitflyer、Kucoin、Bybit、Coinbase Pro、Kraken、Bydfi、Xbit分散交換など、10のトッププラットフォームの中心的な利点と特別な機能を深く分析します。高流動性と豊富な取引タイプを追求している場合でも、安全性、コンプライアンス、革新的な機能に焦点を当てている場合でも、ここで自分に合ったプラットフォームを見つけることができます。トランザクションタイプ、セキュリティ、特別な機能などの包括的な比較を提供して、最も適切な仮想通貨取引プラットフォームを選択し、2025年にデジタル通貨投資の機会をつかむのに役立ちます。

See all articles