大手模型メーカーも力を入れており、Googleも「ボリューム」を公開:Geminiチャットロボットが新型に切り替わり、出力内容もワンクリックで確認できるようになった。

王林
リリース: 2024-07-29 20:38:41
オリジナル
416 人が閲覧しました

Meta や OpenAI などの大手モデル メーカーが集中的に取り組んでいる中、Google もメジャー アップデートを発表しました -

今後、Gemini チャット ロボットは Gemini 1.5 Flash によって駆動されます。

以前のバージョンと比較して、ウィンドウの長さが4倍に増加し、応答速度も速くなりました。

 大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

Googleの紹介によると、チャットボットの新バージョンの背後にある1.5 Flashモデルは軽量化と速度の向上に重点を置いています。

もちろん、モデル応答の品質も向上し、コンテキスト ウィンドウが元の (1.0 Pro ベース) 8k から 32k に増加しました。

 大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

さらに、新バージョンのチャットボットでは、生成されたコンテンツが真実かどうかをワンクリックで検出できる「ファクトチェック」機能も追加され、モデルの錯覚による悪影響を軽減します。

一部のネチズンは、まず今日の Google のパフォーマンスが非常に好調だったと嘆き、その後 Gemini もアップデートをリリースしました。

 大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

願いモードをオンにして、Google Scholar 学術検索に AI 機能が追加されることを楽しみにしている人もいます。

 大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

コンテキストウィンドウの延長と高速化

今回のアップデートの主な内容は、無料版のモデルを1.0Proから1.5 Flashに変更することです。

Gemini 1.5 Flash は、5 月の Google I/O 開発者カンファレンスで初めて発表されました。

トレーニング データの「蒸留」を通じて、Gemini 1.5 フラッシュは、より軽量なサイズでより高い生成品質を実現します。

また、サイズが小さいため、モデルがより高速かつ効率的になり、マルチモーダル推論もサポートされます。

 大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

Googleは、今回のモデルチェンジ後、チャットボットが高速化し、旧バージョン8kのコンテキストウィンドウが32kに拡張されると紹介しました。

ただし、1.5 Flash 自体は 100 万個のコンテキストをサポートしていますが、この減少は確かに小さくありませんが、結局のところ無料バージョンです。

モデルのアップグレードに加えて、もう 1 つの重要なアップデートはファクトチェック機能です。

最新のGeminiチャットボットでは、この機能を利用してワンクリックで出力内容を確認することができます。

システムは出力内のコンテンツを Google で検索して比較し、一致するものと不一致があるものをマークします。

 大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

一部のネチズンは、OpenAI が GPT-4o mini をリリースするのを見て、Google が新しいバージョンをリリースするのは時間の問題だと感じたとコメントしました。

確かに最近はOpenAIやGoogleだけでなく、MetaやMistralなど大型モデルを作っているメーカーも頻繁に動き出しています。

このモデルのパフォーマンスについては、このネチズンも 1.0 Pro と 1.5 Flash を試したと述べています。2 つのパフォーマンスはほぼ同じで、1.5 Flash の方が高速です。

つまり、Google によるこの一連のオペレーションは、最近の「モデルの軽量化」の傾向にもある程度適応しています。

 大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

では、1.5 Flash を置き換えた後の Gemini チャットボットのパフォーマンスはどうですか?

ワンクリックでモデル出力を確認

Qubit は、チャットボットの新しいバージョンで簡単なテストを実行しました。

まず、今回のアップデートのファクトチェック機能を見てみましょう。最初のステップは、通常の会話と同じように質問をすることです。Gemini はそれに普通に答えます。

 大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

回答の下にGoogleのロゴがあるのがわかります。これはファクトチェック機能のボタンです。

クリックすると、システムは自動的に Google で検索し、独自の出力と比較します。

 大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

比較が完了すると、ソースが検索され、一致するコンテンツが緑色で強調表示され、検索結果と一致しない場合は、背景が薄赤色でマークされます。

 大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

マークされた場所をクリックすると、Gemini が比較に使用するコンテンツ リンクが表示されます。

このような注釈は、出力内容が間違っていることを意味するものではないことに注意してください。たとえば、ここで引用した比較データでは、トム・クルーズの母親はメアリー・リー・サウスです。

テキストの不一致のため、回答のこの部分はシステムによってマークされましたが、実際にはどちらも正しい回答です。

 大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

このファクトチェックはインターネット検索に依存しているため、比較情報の品質にもばらつきがあり、100% 正確ではない可能性があります。

たとえば、「林大宇がしだれ柳を根こそぎにする」という古典的なジョークに関しては、双子座は明らかに正解を出しましたが、赤マークが付けられました。

 大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

引用した比較情報を改めて見てみると、確かにストレッチは少し難しいですね。

 大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

つまり、この機能の機能は主に、より便利な認証方法を提供することですが、それをどのように受け入れるかは、複数の当事者による認証とユーザー自身の判断に依存します。

さらに、モデル自体に関しては、大きなモデルが壁にぶつかることが多い、最近よく見られるいくつかの問題もテストしました。

たとえば、ジェミニは 2 つの数字をお金に変換しましたが、1 回の操作後の最終結果は…間違っていました。

この質問が発見されて以来、これが 2 番目に面白い答えであれば、1 位を主張するモデルは誰もいません。

 大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

私も最初は間違った答えをしてしまいましたが、後ほど分析の過程で修正しました。

 大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

しかし、英語で質問すれば、正しく答えられる可能性はまだあります。

 大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

別の質問ですが、この答えは実際に中国語の文字を数えることができます...これは人々を混乱させます、そしてそれはまったく予測の範囲内ではありません。

 大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

最後に、このアップデートで言及された速度の向上については、テストの結果、Gemini 1.5 Flash は Claude 3 Haiku よりも最初の単語を出力する時間が短いことが判明しました。その後の速度の違いは、肉眼ではあまり明らかではありません。

 大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

上記はチャットボットにおける Gemini 1.5 Flash のパフォーマンスです。興味のある読者はご自身で試してみてください。

参考リンク:

[ 1 ] https://blog.google/products/gemini/google-gemini-new-features-july-2024/

[ 2 ] https://x.com/GeminiApp/status /1816512086232731696

以上が大手模型メーカーも力を入れており、Googleも「ボリューム」を公開:Geminiチャットロボットが新型に切り替わり、出力内容もワンクリックで確認できるようになった。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ソース:myzaker.com
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
最新の問題
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート
私たちについて 免責事項 Sitemap
PHP中国語ウェブサイト:福祉オンライン PHP トレーニング,PHP 学習者の迅速な成長を支援します!