大模型厂商密集发力,谷歌也开'卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容
Meta、OpenAI 等大模型厂商密集发力之际,谷歌也宣布了一项重磅更新——
即日起,Gemini 聊天机器人将改由Gemini 1.5 Flash驱动。
与之前的版本相比,窗口长度提高到了 4 倍,响应速度也更快了。
按照谷歌的介绍,新版聊天机器人背后的 1.5 Flash 模型,主打的就是轻量化和速度提升。
当然模型回复的质量也有提升,上下文窗口也从原先(基于 1.0 Pro)的 8k 提升到了 32k。
此外新版聊天机器人还增加了" 事实核查 " 功能,可以一键检测生成的内容是否属实,减轻模型幻觉带来的不良影响。
有网友感叹,谷歌今天表现真的很强,先是,接着 Gemini 也发布了更新。
还有人开启了许愿模式,期待 Google Scholar 学术搜索当中也能加入 AI 功能。
更长上下文窗口,速度也变快了
本次更新的最主要内容,就是把免费版背后的模型从 1.0Pro 换成了 1.5 Flash。
Gemini 1.5 Flash 最早亮相于 5 月的谷歌 I/O 开发者大会。
通过训练数据的 " 蒸馏 ",Gemini 1.5 Flash 用更轻量化的体积实现了较高的生成质量。
而且小体积也让模型的速度更快、效率更高,同时它还支持多模态推理。
谷歌介绍,此次更换模型之后,聊天机器人的速度会变得更快,同时旧版 8k 的上下文窗口,扩增到了 32k。
不过 1.5 Flash 自身是支持 1 百万的上下文的,这样的削减幅度属实是不小,但毕竟是免费免费版本。
除了模型的升级,另外一项重要更新就是事实核查功能了。
在最新的 Gemini 聊天机器人当中,可以通过该功能一键对输出的内容进行检查。
系统会针对输出中的内容在谷歌上进行搜索和比对,然后标记出相符和不符之处。
有网友评论说,看到 OpenAI 上线 GPT-4o mini 时就觉得谷歌上新只是个时间问题。
的确,不仅是 OpenAI 和谷歌,Meta、Mistral 等在做大模型的厂商最近都是动作频繁。
而关于模型的表现,这位网友也表示自己试过 1.0 Pro 和 1.5 Flash,两者表现几乎相同,而 1.5 Flash 速度更快。
所以,谷歌的这波操作,一定程度上也是适应了最近兴起的 " 模型轻量化 " 趋势。
那么,更换了 1.5 Flash 之后的 Gemini 聊天机器人,表现到底怎样呢?
一键检查模型输出
量子位对新版的聊天机器人进行了简单测试。
首先来看一下这次更新的事实核查功能,第一步是像正常对话一样随便提一个问题,Gemini 也会正常作答。
可以看到在答案的下方有一个谷歌的 logo,这就是事实核查功能的按钮了。
点击之后系统会自动在谷歌进行搜索,然后与自己的输出内容进行比对。
比較が完了すると、ソースが検索され、一致するコンテンツが緑色で強調表示され、検索結果と一致しない場合は、背景が薄赤色でマークされます。
マークされた場所をクリックすると、Gemini が比較に使用するコンテンツ リンクが表示されます。
このような注釈は、出力内容が間違っていることを意味するものではないことに注意してください。たとえば、ここで引用した比較データでは、トム・クルーズの母親はメアリー・リー・サウスです。
テキストの不一致のため、回答のこの部分はシステムによってマークされましたが、実際にはどちらも正しい回答です。
このファクトチェックはインターネット検索に依存しているため、比較情報の品質にもばらつきがあり、100% 正確ではない可能性があります。
たとえば、「林大宇がしだれ柳を根こそぎにする」という古典的なジョークに関しては、双子座は明らかに正解を出しましたが、赤マークが付けられました。
引用した比較情報を改めて見てみると、確かにストレッチは少し難しいですね。
つまり、この機能の機能は主に、より便利な認証方法を提供することですが、それをどのように受け入れるかは、複数の当事者による認証とユーザー自身の判断に依存します。
さらに、モデル自体に関しては、大きなモデルが壁にぶつかることが多い、最近よく見られるいくつかの問題もテストしました。
たとえば、ジェミニは 2 つの数字をお金に変換しましたが、1 回の操作後の最終結果は…間違っていました。
この質問が発見されて以来、これが 2 番目に面白い答えであれば、1 位を主張するモデルは誰もいません。
私も最初は間違った答えをしてしまいましたが、後ほど分析の過程で修正しました。
しかし、英語で質問すれば、正しく答えられる可能性はまだあります。
別の質問ですが、この答えは実際に中国語の文字を数えることができます...これは人々を混乱させます、そしてそれはまったく予測の範囲内ではありません。
最後に、このアップデートで言及された速度の向上については、テストの結果、Gemini 1.5 Flash は Claude 3 Haiku よりも最初の単語を出力する時間が短いことが判明しました。その後の速度の違いは、肉眼ではあまり明らかではありません。
上記はチャットボットにおける Gemini 1.5 Flash のパフォーマンスです。興味のある読者はご自身で試してみてください。
参考リンク:
[ 1 ] https://blog.google/products/gemini/google-gemini-new-features-july-2024/
[ 2 ] https://x.com/GeminiApp/status /1816512086232731696
以上是大模型厂商密集发力,谷歌也开'卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

Google由AlphabetInc.拥有,Alphabet由拉里·佩奇和谢尔盖·布林控制:1)通过持有B类股票(每股10票投票权),创始人确保对公司的控制权;2)Alphabet的A类和C类股票分别在公开市场和员工持股计划中流通,但不影响创始人的控制权。

本文详细介绍了欧易OKEx账号的注册、使用和注销流程。注册需下载APP,输入手机号或邮箱注册,完成实名认证。使用方面涵盖登录、充值提现、交易以及安全设置等操作步骤。而注销账号则需要联系欧易OKEx客服,提供必要信息并等待处理,最终获得账号注销确认。 通过本文,用户可以轻松掌握欧易OKEx账号的完整生命周期管理,安全便捷地进行数字资产交易。

Googlelady的姓名是GoogleAssistant。1.GoogleAssistant是Google开发的智能虚拟助手,利用NLP、ML和语音识别技术与用户互动。2.其工作原理包括语音识别、自然语言处理、响应生成和任务执行。3.用户可以通过API进行基本和高级交互,如查询天气或控制智能家居设备。

gate.io手机app使用教程:1、安卓用户,访问 Gate.io 官方网站,下载安卓安装包,您可能需要在手机设置中允许安装来自未知来源的应用;2、ios用户,在 App Store 中搜索 "Gate.io" 下载。

如何优化jieba分词以改善景区评论的关键词提取?在使用jieba分词处理景区评论数据时,如果发现分词结果不理�...

虚拟货币“最老”排行榜如下:1. 比特币(BTC),发行于2009年1月3日,是首个去中心化数字货币。2. 莱特币(LTC),发行于2011年10月7日,被称为“比特币的轻量版”。3. 瑞波币(XRP),发行于2011年,专为跨境支付设计。4. 狗狗币(DOGE),发行于2013年12月6日,基于莱特币代码的“迷因币”。5. 以太坊(ETH),发行于2015年7月30日,首个支持智能合约的平台。6. 泰达币(USDT),发行于2014年,是首个与美元1:1锚定的稳定币。7. 艾达币(ADA),发

Google'soldnamewas“ Backrub”,反射initialFocusonAnalyzingBacklinkss.1)启动asbackrubatstanfordin196,itusedabasicbacklinkalgorithm.2)rebrandedtogooglein197197,象征性abrodizingabroadeerambitiontoorganizeInterneTertinEnterneTineTineTineTIN.3)

H5部署后视频媒体获取问题处理在部署H5应用时,有时会遇到页面视频媒体获取的问题,特别是当使用navigator.medi...
