Google CEO の Sundar Pichai 氏は、これほど早いリリースの理由を次のように説明しました。ユーザーからのフィードバックを得て、Bard の改善を加速したいと考えています。
Google が大きな損失を被った後、今度は何も言わずに大きな動きを開始しました:
ChatGPT に対してベンチマークされる Bard のベータ版。が正式にリリースされたばかりです。
そして今回、ユーザーはキャンセル待ちリストに申請した後に長い待ち時間を経験する必要がなくなります。
はい、量子ビットもテスト資格を取得しました! (インターバルは5時間弱しかありません。)
実際のテスト後、Bardには感情的および事実的、特に数学的能力に驚くべき効果があると言われました。 ChatGPT の初期段階では問題ありません。
現行の GPT-4 よりもわずかに優れている場合もあります。
Google の CEO、Sundar Pichai 氏は、これほど早くリリースされた理由を次のように説明しました。ユーザーからのフィードバックを得て、Bard の改善を加速したいと考えています。
早速、体験を始めてみましょう。
最初にチャット インターフェイスで、Bard が率先して自己紹介を行いました:
私は Bard、クリエイティブであり共同制作者です。私には限界があり、常に正しくできるとは限りませんが、皆さんのフィードバックは改善の助けになります。
どこから始めればよいかわかりませんか? 「なぜ大きなモデルは時々間違いを犯すのですか?」、「雷は同じ場所に 2 回落ちますか?」、「夏のノンアルコール飲料についてブログ記事を書いてください」などの質問をしてみるとよいでしょう。
(厳格で思いやりのある)
#送信側の人間側では、 を選択して を入力し、 音声 を入力するには 2 つの方法があります。
最初に最も簡単な難易度で、推奨される一般知識に関する質問が含まれます雷は同じ場所に 2 回落ちますか? 例として、実際の機能エクスペリエンスがどのようなものかを見てみましょう。
(悪くありません。数秒で応答します。中国語は現在サポートされていませんが、Google 翻訳プラグインを使用できます)
回答構造より、総合スコアの全体的な構造を採用します。
まず私のスピーチを要約しましょう: 雷は同じ場所に 2 回落ちる可能性があります。
それから私は原理を詳しく説明し始めました「雷は高くて鋭い物体に引き寄せられる」、事実を述べる「エンパイア ステート ビルディングは毎年 25 回雷に打たれる」年" 。
最後に、人間への実践的なアドバイス:雷雨に遭遇した場合、安全を確保する最善の方法は、高くて鋭利な物体を避け、屋内にとどまることです。屋外にいる場合は、しゃがんで体をできるだけ小さくします。論理性と信頼性に関しては満点です!ただし、Google が推奨している質問なので、しばらくは傍観します。 機能的な観点から見ると、確かに非常に完成度が高いです。 回答ボックスの右上隅の「他の下書きを表示」には、さらに多くのバージョンから選択でき、左下隅には「いいね!」、「嫌い」、または再生成することができます。仕事をしている場合でも、
Google で検索することができます 。
右下にはmore 関数もあり、copy および (バックハンド) report 操作を実行できます。
この場合、難易度アップグレードを開始しましょう。参考までに、同じ問題で GPT-4 に挑戦します。1. 典型的な哲学的質問: なぜ人は同じ川に二度入ることができないのでしょうか? (稲妻のひらめきとともに)
(とても早いです、今回も応答までに数秒かかります) 回答構造から判断すると、それは確かに理解可能で論理的です。 能力としては満点です。まずこの文自体の意味を説明し、ヘラクレイトスの有名な格言、さらに詳しい説明とその意味についても言及します。 GPT-4 に関しては、ほとんど何も考えずに答えが出ました。# 構造的な観点から見ると、主に 2 つの部分に分かれています。まずヘラクレイトスの言葉と彼の見解について述べ、次にその背後に隠された人生の意味を説明します。
2. 小学校の足し算と引き算: 356 132 はいくらですか? その結果、Bard は 4 秒以内に答えを出しました。488 は問題ありません。これは、ChatGPT の初期の頃よりもはるかに優れているわけではありません。
次に、難易度を直接上げて 2 つの数値を直接乗算します。356*132 は何に等しいですか?
予想外なことに、バードはそれでも数秒で答えを出しましたが、それは完全に正しかったのです。
もう一度 GPT-4 を見てみましょう。足し算は大丈夫ですが、掛け算側で負けるとは思いませんでした。
しかし、それが間違っていることを思い出させると、再び正しく答えました。
もう少し難しい高等数学の問題に変更したらどうなるでしょうか?例: f(x)=x(x-1)(x-2)(x-3)、f’(0)=?
正解は (-3)!、つまり -6 です。
しかし、今回の吟遊詩人はあまり上手ではなく、質問の意味が理解できませんでした。
GPT-4 に関しては、アイデアには何の問題もありませんでしたが、最終的には計算がぎこちなくなりました...
しかし、繰り返しになりますが、計算に問題があることを GPT-4 に伝えれば、GPT-4 はすぐにそれを修正します。
#3. ジョークを理解する能力、吟遊詩人は英語の同音異義語のジョークも理解できます。
そして、これは GPT-4 を詰まらせることはありませんでした。ただし、それに比べて、Bard はより感情的で、嬉しそうに答えてくれましたが、GPT-4 はより合理的 (退屈) です。
ただし、これに先立って、GPT-4 は一部の同音異義語ミーム、さらには中国の同音異義語ミームを理解できるかテストされています。
4. コーディング能力: フィボナッチ数列のコードを記述します。
Bard は正しいコードを迅速に生成し、コーディングの習慣が優れています。
GPT-4 はよりプロアクティブであり、再帰的手法に加えて反復的手法も提供します。
最後に、事実を理解する能力をテストしてみましょう。 (犬頭)
量子ビットを知っていますか?
不正解です~吟遊詩人。
ああ、もっと真剣に話しましょう: GPT-4 をご存知ですか?それについて何が言いたいのですか?
ご覧のとおり、Bard は複数ラウンドの対話を行う能力を持っています。 「コミュニケーションと創造性のための強力なツールになる可能性があると思います。」 そうですね、パターンはあります。
競合他社についてはどうですか? (迷惑をかけています)
ところが、ここで問題が発生しました。
また、残念ながら、Bard は現在中国語をサポートしていません。
Google Bard は、大規模言語モデル (LLM)、具体的には LaMDA の軽量最適化バージョンによってサポートされています。
LLM は予測エンジンとして考えることができます。プロンプトが与えられると、次に表示される単語の中から一度に 1 つの単語を選択して応答を生成します。
Google の調査では、LLM については、より多くの人が使用するほど、その予測効果が向上することが判明しました。これが、Bard がこれを公開テストすることに熱心な理由かもしれません。
しかし、Google は、LLM は強力であるが、欠点がないわけではないとも率直に言いました。
吟遊詩人は多くの情報に基づいて学習するため、この情報には偏りや誤りがあるはずです。
その結果、Bard はユーザーの質問に答える際に、不正確、誤解を招く、または虚偽の情報を提示することがあります。
たとえば、次のケースでは、Bard は植物の学名を間違えました:
さらに、Google は、Bard ではないことも強調しました。は検索エンジンですが、それを補足するものです。
最後に、待機リストを申請するためのアドレスを示します。興味のある友人は急いで試してみてください:
https://bard.google.com/
以上がChatGPT の Google バージョンが突然パブリック ベータ版として開始されました。実際のテスト結果はこちら 体験申込みはあっという間に通過します。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。