AIGC 業界の 2 つの最大の競合相手: ChatGPT 対 Google Bard! この記事では、これら 2 つの人工知能エンジンの技術的な違いを紹介します。
翻訳者 | Cui Hao
レビュアー | Sun Shujuan
AIGC 業界の 2 つの最大の競合相手: ChatGPT 対 Google Bard! この記事の説明これら 2 つの人工知能エンジンの技術的な違い。
Google Bard と ChatGPT のこれまでの最大の違いは、Bard は ChatGPT について知っていますが、ChatGPT は Bard について知りません。 ChatGPT を試すことはできますが、Bard はまだほとんどの人にとって手の届かないところにあります。
ChatGPT と Google Bard はどちらも人工知能チャットボットです。人工知能の簡易版はすでに携帯電話で利用可能で、「良い」と入力すると、次の単語が「朝」であると携帯電話が予測する。
ChatGPT は元々 OpenAI によって開発され、その後 Microsoft によって驚くべき 100 億ドルの資金提供を受けました (以前の 10 億ドルの投資に加えて)。 Google 側は、検索の独占が終わりを迎えるかもしれないと若干パニックになり、Bard を立ち上げましたが、このバージョンにはまだいくつかの欠陥がありました。初めてのライブ デモンストレーション中に、バードは Google を当惑させるいくつかの事実上の誤りを犯しました。
ChatGPT と Google Bard はスマートフォンの予測テキスト機能よりも複雑です。これら 2 つの知能ロボットの違いを理解したい場合は、次のコンテンツを見逃すことはできません。
ここでは、2 つの人工知能エンジンの技術的な違いについて詳しく説明します。
次の表から、多くの詳細を確認することで、両者の技術的な違いをすぐに理解できます。
# #C hatGPT |
B ard |
|
GPT-3.5 | LaMDA、つまり、対話アプリケーションの言語モデル | |
Transformer | Transformer |
|
トレーニング データ |
ネットワーク テキスト、主にデータセットは「common Crawl」と呼ばれ、2021 年半ばに予定されています。 |
156 万語の公開対話データとネットワーク テキスト |
目的 | 多目的テキスト生成チャットボットになる |
#検索支援専用 |
パラメータ |
##1,750 億パラメータ | ##1,370 億パラメータ# #クリエイター |
OpenAI | 利点 | |
#- より柔軟でオープンテキストを処理可能 | #- トレーニング データは 2021 年時点のものです
-現在のトレーニング データ - 会話用に特別にトレーニングされているため、話しかけるとより人間らしく聞こえます。 |
|
欠点 |
#- 対話はそれほど説得力がありません #- そうではありません慎重に微調整してください ##-まだです | ##-一般的なテキスト作成には適していない可能性があります
# 上の表で 2 つの違いを理解した後、他の指標について詳しく見てみましょう。 ChatGPT とは何ですか?ChatGPTは2022年11月30日、突如ステージに現れました。 2022 年 12 月 4 日の時点で、このサービスの毎日のユーザー数は 100 万人を超えています。 2023 年 1 月には、このユーザー数は 1 億人を超えました。 このツールが突然人気を博した基本的な理由は、多くのトピックに対してほぼ人間のような方法で信頼できる回答を提供でき、インターネット接続があれば誰でも使用できることです。 ChatGPT は、フレンドリーな人工知能ソリューションの作成に焦点を当てている、サンフランシスコにある人工知能研究所である OpenAI によって作成されました。チャットボットは、テキストが与えられると要求者に応答を継続的に提供できる大規模な言語モデルである GPT-3.5 に基づいて開発されています。 ChatGPT は、これに基づいて追加のトレーニングを追加します。人間のトレーナーがモデルとの対話を通じてモデルを改善し、「報酬」を通じて高品質の回答を提供する能力をモデルに与えます。 トレーニング データGPT-3.5 は、Common Crawl と呼ばれる一般的なデータセットを含む、巨大な Web テキスト データセットでトレーニングされます。 Common Crawl には、生の Web ページ データ、メタデータ抽出、テキスト抽出など、ペタバイト単位の Web データが含まれています。たとえば、StrataScratch からの URL のコレクションが含まれています。 ChatGPT で使用されるトレーニング データが ChatGPT でのネチズンの入力から来ていると考えるのはクレイジーではありませんか? Common Crawl はトレーニング データの 60% を担当しますが、GPT-3.5 には他のデータ ソースもあります。 Google Bard とは何ですか?Google Bard は、ChatGPT が非常に人気になったときに Google によって発売されたインテリジェントなチャット ロボットです。 ChatGPT とは異なり、Bard は Google 独自のモデルである LaMDA を利用しています。 LaMDA は Language Model for Conversational Applications の略称ですが、ChatGPT とは異なり、ほとんどの人がまだアクセスできないという単純な理由から、それほど驚くべきものではありません。 Google は 2 月初旬に Bard のぎこちないデモを公開しましたが、現在 Bard を利用できるのは選ばれた少数の人だけです。 Google Bard の主な利点は、インターネットにオープンであることです。 ChatGPT に「今の大統領は誰ですか?」と尋ねても、それはわかりません。これは、2021 年半ば頃に学習データが途切れたためです。一方、バード氏は現在インターネットで入手可能な情報を利用しました。理論的には、バード氏は今日インターネット上のデータを抽出して、現在誰が大統領であるかを伝えることができるはずです。 Bard がいくつかの重要な側面で ChatGPT よりも優れていることが簡単にわかります。 トレーニング データまず第一に、LaMDA は、GPT-n モデルのようなテキストを単に生成するのではなく、会話、特に会話についてトレーニングされます。 ChatGPT はトレーニング データについて恥ずかしがりませんが、Bard がトレーニングされたデータについてはあまりわかっておらず、LaMDA の研究論文を見ることで推測できます。 Googleの研究者らは、トレーニングデータの12.5%がGPT-nモデルなどのCommon Crawlから来ていると述べている。さらに 12.5% はウィキペディアからのものです。研究論文によると、彼らは1兆5600億語の「公衆の会話データとネットワークテキスト」を使用したという。 完全な内訳は次のとおりです:
上記の情報から、データを共同で知ることができます。もちろん、Wikipedia もあります。残りのデータは明らかに Google によって意図的に隠蔽されており、おそらく Bard (および LaMDA) が模倣されるのを防ぐためと思われます。 LaMDA は、もともと Google が開発したオープンソースのニューラル ネットワーク アーキテクチャである Transformer のニューラル言語モデルを微調整することによって形成されました。 (GPT も Transformer に基づいています)。 ChatGPT には煩わしさやナンセンスな発言を防ぐための障壁がいくつかありますが、Google は Bard をより優れた安全なチャット ロボットにするために品質を確保する方法を重視しています。 Bard は「高品質、根拠のある、安全」になるよう微調整されています。 Google はこれについて多くのことを述べているので、関連するブログ投稿を読むことをお勧めしますが、あまり時間がない場合は、基本的に次の側面に分けることができます。
原題: ChatGPT vs Google Bard: A Comparison of the Technical Differences 、著者: Nate Rosidi |
以上がChatGPT と Google Bard: どちらが優れていて、どちらが悪いのでしょうか? 違いを大きくレビューします!の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。