首页 硬件教程 硬件测评 大模型厂商密集发力,谷歌也开'卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

大模型厂商密集发力,谷歌也开'卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

Jul 29, 2024 pm 08:38 PM
flash 谷歌 聊天机器人 google 美图 轻量化

Meta、OpenAI 等大模型厂商密集发力之际,谷歌也宣布了一项重磅更新——

即日起,Gemini 聊天机器人将改由Gemini 1.5 Flash驱动。

与之前的版本相比,窗口长度提高到了 4 倍,响应速度也更快了。

 大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

按照谷歌的介绍,新版聊天机器人背后的 1.5 Flash 模型,主打的就是轻量化和速度提升。

当然模型回复的质量也有提升,上下文窗口也从原先(基于 1.0 Pro)的 8k 提升到了 32k。

 大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

此外新版聊天机器人还增加了" 事实核查 " 功能,可以一键检测生成的内容是否属实,减轻模型幻觉带来的不良影响。

有网友感叹,谷歌今天表现真的很强,先是,接着 Gemini 也发布了更新。

 大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

还有人开启了许愿模式,期待 Google Scholar 学术搜索当中也能加入 AI 功能。

 大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

更长上下文窗口,速度也变快了

本次更新的最主要内容,就是把免费版背后的模型从 1.0Pro 换成了 1.5 Flash。

Gemini 1.5 Flash 最早亮相于 5 月的谷歌 I/O 开发者大会。

通过训练数据的 " 蒸馏 ",Gemini 1.5 Flash 用更轻量化的体积实现了较高的生成质量。

而且小体积也让模型的速度更快、效率更高,同时它还支持多模态推理。

 大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

谷歌介绍,此次更换模型之后,聊天机器人的速度会变得更快,同时旧版 8k 的上下文窗口,扩增到了 32k。

不过 1.5 Flash 自身是支持 1 百万的上下文的,这样的削减幅度属实是不小,但毕竟是免费免费版本。

除了模型的升级,另外一项重要更新就是事实核查功能了。

在最新的 Gemini 聊天机器人当中,可以通过该功能一键对输出的内容进行检查。

系统会针对输出中的内容在谷歌上进行搜索和比对,然后标记出相符和不符之处。

 大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

有网友评论说,看到 OpenAI 上线 GPT-4o mini 时就觉得谷歌上新只是个时间问题。

的确,不仅是 OpenAI 和谷歌,Meta、Mistral 等在做大模型的厂商最近都是动作频繁。

而关于模型的表现,这位网友也表示自己试过 1.0 Pro 和 1.5 Flash,两者表现几乎相同,而 1.5 Flash 速度更快。

所以,谷歌的这波操作,一定程度上也是适应了最近兴起的 " 模型轻量化 " 趋势。

 大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

那么,更换了 1.5 Flash 之后的 Gemini 聊天机器人,表现到底怎样呢?

一键检查模型输出

量子位对新版的聊天机器人进行了简单测试。

首先来看一下这次更新的事实核查功能,第一步是像正常对话一样随便提一个问题,Gemini 也会正常作答。

 大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

可以看到在答案的下方有一个谷歌的 logo,这就是事实核查功能的按钮了。

点击之后系统会自动在谷歌进行搜索,然后与自己的输出内容进行比对。

 大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

比較が完了すると、ソースが検索され、一致するコンテンツが緑色で強調表示され、検索結果と一致しない場合は、背景が薄赤色でマークされます。

 大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

マークされた場所をクリックすると、Gemini が比較に使用するコンテンツ リンクが表示されます。

このような注釈は、出力内容が間違っていることを意味するものではないことに注意してください。たとえば、ここで引用した比較データでは、トム・クルーズの母親はメアリー・リー・サウスです。

テキストの不一致のため、回答のこの部分はシステムによってマークされましたが、実際にはどちらも正しい回答です。

 大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

このファクトチェックはインターネット検索に依存しているため、比較情報の品質にもばらつきがあり、100% 正確ではない可能性があります。

たとえば、「林大宇がしだれ柳を根こそぎにする」という古典的なジョークに関しては、双子座は明らかに正解を出しましたが、赤マークが付けられました。

 大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

引用した比較情報を改めて見てみると、確かにストレッチは少し難しいですね。

 大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

つまり、この機能の機能は主に、より便利な認証方法を提供することですが、それをどのように受け入れるかは、複数の当事者による認証とユーザー自身の判断に依存します。

さらに、モデル自体に関しては、大きなモデルが壁にぶつかることが多い、最近よく見られるいくつかの問題もテストしました。

たとえば、ジェミニは 2 つの数字をお金に変換しましたが、1 回の操作後の最終結果は…間違っていました。

この質問が発見されて以来、これが 2 番目に面白い答えであれば、1 位を主張するモデルは誰もいません。

 大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

私も最初は間違った答えをしてしまいましたが、後ほど分析の過程で修正しました。

 大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

しかし、英語で質問すれば、正しく答えられる可能性はまだあります。

 大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

別の質問ですが、この答えは実際に中国語の文字を数えることができます...これは人々を混乱させます、そしてそれはまったく予測の範囲内ではありません。

 大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

最後に、このアップデートで言及された速度の向上については、テストの結果、Gemini 1.5 Flash は Claude 3 Haiku よりも最初の単語を出力する時間が短いことが判明しました。その後の速度の違いは、肉眼ではあまり明らかではありません。

 大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

上記はチャットボットにおける Gemini 1.5 Flash のパフォーマンスです。興味のある読者はご自身で試してみてください。

参考リンク:

[ 1 ] https://blog.google/products/gemini/google-gemini-new-features-july-2024/

[ 2 ] https://x.com/GeminiApp/status /1816512086232731696

以上是大模型厂商密集发力,谷歌也开'卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容的详细内容。更多信息请关注PHP中文网其他相关文章!

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

<🎜>:泡泡胶模拟器无穷大 - 如何获取和使用皇家钥匙
4 周前 By 尊渡假赌尊渡假赌尊渡假赌
北端:融合系统,解释
4 周前 By 尊渡假赌尊渡假赌尊渡假赌
Mandragora:巫婆树的耳语 - 如何解锁抓钩
3 周前 By 尊渡假赌尊渡假赌尊渡假赌

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

热门话题

Java教程
1670
14
CakePHP 教程
1428
52
Laravel 教程
1329
25
PHP教程
1276
29
C# 教程
1256
24
谁实际拥有Google? 谁实际拥有Google? Apr 02, 2025 pm 04:01 PM

Google由AlphabetInc.拥有,Alphabet由拉里·佩奇和谢尔盖·布林控制:1)通过持有B类股票(每股10票投票权),创始人确保对公司的控制权;2)Alphabet的A类和C类股票分别在公开市场和员工持股计划中流通,但不影响创始人的控制权。

欧易okex账号怎么注册、使用、注销教程 欧易okex账号怎么注册、使用、注销教程 Mar 31, 2025 pm 04:21 PM

本文详细介绍了欧易OKEx账号的注册、使用和注销流程。注册需下载APP,输入手机号或邮箱注册,完成实名认证。使用方面涵盖登录、充值提现、交易以及安全设置等操作步骤。而注销账号则需要联系欧易OKEx客服,提供必要信息并等待处理,最终获得账号注销确认。 通过本文,用户可以轻松掌握欧易OKEx账号的完整生命周期管理,安全便捷地进行数字资产交易。

Google女士的名字是什么? Google女士的名字是什么? Apr 06, 2025 am 12:01 AM

Googlelady的姓名是GoogleAssistant。1.GoogleAssistant是Google开发的智能虚拟助手,利用NLP、ML和语音识别技术与用户互动。2.其工作原理包括语音识别、自然语言处理、响应生成和任务执行。3.用户可以通过API进行基本和高级交互,如查询天气或控制智能家居设备。

gate.io手机app使用教程 gate.io手机app使用教程 Mar 26, 2025 pm 05:15 PM

gate.io手机app使用教程:1、安卓用户,访问 Gate.io 官方网站,下载安卓安装包,您可能需要在手机设置中允许安装来自未知来源的应用;2、ios用户,在 App Store 中搜索 &quot;Gate.io&quot; 下载。

如何优化jieba分词以改善景区评论的关键词提取效果? 如何优化jieba分词以改善景区评论的关键词提取效果? Apr 01, 2025 pm 06:24 PM

如何优化jieba分词以改善景区评论的关键词提取?在使用jieba分词处理景区评论数据时,如果发现分词结果不理�...

虚拟币最老的币排行榜最新更新 虚拟币最老的币排行榜最新更新 Apr 22, 2025 am 07:18 AM

虚拟货币“最老”排行榜如下:1. 比特币(BTC),发行于2009年1月3日,是首个去中心化数字货币。2. 莱特币(LTC),发行于2011年10月7日,被称为“比特币的轻量版”。3. 瑞波币(XRP),发行于2011年,专为跨境支付设计。4. 狗狗币(DOGE),发行于2013年12月6日,基于莱特币代码的“迷因币”。5. 以太坊(ETH),发行于2015年7月30日,首个支持智能合约的平台。6. 泰达币(USDT),发行于2014年,是首个与美元1:1锚定的稳定币。7. 艾达币(ADA),发

Google的旧名称是什么? Google的旧名称是什么? Apr 05, 2025 am 12:12 AM

Google'soldnamewas“ Backrub”,反射initialFocusonAnalyzingBacklinkss.1)启动asbackrubatstanfordin196,itusedabasicbacklinkalgorithm.2)rebrandedtogooglein197197,象征性abrodizingabroadeerambitiontoorganizeInterneTertinEnterneTineTineTineTIN.3)

在HTTP页面中如何解决navigator.mediaDevices返回undefined的问题? 在HTTP页面中如何解决navigator.mediaDevices返回undefined的问题? Apr 05, 2025 am 07:30 AM

H5部署后视频媒体获取问题处理在部署H5应用时,有时会遇到页面视频媒体获取的问题,特别是当使用navigator.medi...

See all articles