GPT-4终于可以联网、用插件了,我用完的评价是:拉了
在被各种号称“ 炸裂 ”、“ 颠覆 ”的 AI 新闻的轰炸下,说实话,差评君已经有点麻了。。。
但这次,差评君打起来十二分的精神,因为真正有料的的终于来了。
就在这两天,随着 OpenAI 向 Plus 用户全面开放自己的第三方插件,差评君也有了使用插件的资格。
只要大家是 ChatGPT 的付费用户,在设置里打开 “Beta features” 里的 “Web browsing” 和 “Plugins” 。
接下来,只要在聊天页面选择需要启用的功能,就能在对话中使用了。
不过要注意的是,这个“ Web browsing ”和“ Plugins ”只能二选一,并不能同时使用。
而且 GPT-4 这次的图标也改成了紫色
不过这两个功能都只能单独使用,所以,我们先尝试了一下 ChatGPT 自带的网页搜索功能。
我们都知道, GPT-4 的模型数据集只收集到 21 年 9 月份,所以我问了它一个最近很火的游戏,王国之泪。
这次它终于摆脱了单机模式,直接上网搜索了 “ 王国之泪 ” 的关键词,然后找到了 “ 王国之泪 ” 的维基百科。
在阅读相关内容后,输出了回答,而且还顺便给咱做了一个翻译。
这么来看,联网了的 GPT-4 的大脑,又扩容了。
不过呢,当我想要些更细致的信息时, GPT-4 虽然会尝试去浏览网页,但,都进不去。
于是我转头去试了试 NewBing ,就没发现有类似的问题。
对此,差评君只能理解为 ChatGPT 在爬取国内内容时,爬取手段太过直白,直接被当成机器人给拒绝访问了。
不过, ChatGPT 的网络浏览也不是一无是处,相对于现在的 Newbing ,当我需要一个更加详尽的回答时,比如让它对暴雪收购案进行评价, Newbing 可能是由于限制问题,只给出了短短几句的回答,数据还不新。
反观 GPT-4 不仅获取了正确信息,而且还对新闻的细节进行了总结。
唯一需要吐槽的,就是整个的生成过程速度有点慢。
而在第三方插件方面,这次刚好也有个名叫 KeyMate.AI Search 的工具能辅助搜索。
只不过,这插件反而不如上述 ChatGPT 自带的网页浏览功能好用。
虽然它按照要求给出了链接,但是,点进去,是一个无法访问的视频。。。至于知乎,依旧拒绝访问。。。
最后,它出门左转在 IGN 的官网,帮我找了一些资料。
除了这个实时搜索, ChatGPT 其它插件的能力又如何呢?
首先,就是在学术教育和数学能力上,有了插件的加持, GPT-4 再也不是从前的那个数学小白了。
原因就是这个能做数学题的神器:Wolfram 插件,
相对于原始网站,加载了插件的 GPT-4 ,更像是一个老师。
在答案上, GTP-4 除了能帮你把过程给写出来,在解答过程中,当我要求它去对一些关键步骤进行解释时,这个回答就更详细了。
不过在一些难度更高的题目面前, Wolfram 就有点应付不来了。
比如这道 2022 年全国卷的数学最后一道大题,不管我尝试几次,它都没办法算出来。
但,问题也不止这一点,在我测试其它的一些插件时,比如这个 ScholarAI ,它是一个能帮我查找发表在 Springer Nature 上的期刊的插件。
因为这个插件只能寻找 Springer Nature 上的内容,所以在检索时,经常会搜不到需要的文章,其次,它也无法直接帮我们阅读全文,想要阅读全文,还得点进去下载 PDF 。。。
这种检索方法基本与常规搜索引擎无异,还不如直接使用搜索引擎搜索,然后自行筛选所需论文。
当然了,决定 ChatGPT 的插件功能好不好,最重要的还是能不能解决问题。
大家还记得,上次 OpenAI 在发布插件预告的时候,最让人惊艳的就是对生活出行的一键解决了。
正好,公司最近组织大家去日本大阪团建,这时候谁来做这个攻略就是个互相甩锅的大问题了。
于是,不出意料的,这个问题被大家丢给 GPT 的新插件了。
结果,万万没想到翻车竟然来的如此突然。
首先我使用了 Weather Report Data ( 天气报道插件,这里有个伏笔), Expedia ( 旅游插件 )还有 OpenTable ( 订餐插件 )这三个插件去帮忙制定这几天的行程。
问了问 GPT , 5 月 24 日后 5 天的天气情况,并要求它给我推荐几个好吃的、好玩。
GPT 竟然傲娇起来了, 5 月 24 号,也就是未来的天气竟然不能实时显示。
直接就让隔壁的好兄弟, New Bing 看了个大笑话。
甚至连, GPT 家族中的没有联网能力的小弟弟 GPT-3 ,都凭借 21 年的数据猜出来。( 虽然明显是猜的 )
多少让我有些哭笑不得了。
不过,后来咱看了看这个 Weather Report Data ,发现它只提供实时的天气信息,也就是没法提供未来的天气预测,而目前还没有其它的天气预报插件。
但这样我就要吐槽了,光看名字,这个叫做 “Weather Report Data” 的插件,怎么看都是一个常用的天气软件吧。
就这取名规则,放在苹果商店里,可是会因为 “ 误导性语言 ” 要被一顿毒打,逐出苹果生态圈的。
所以咱只好再重新切换使用 “Web browsing” 来查询,这才知道未来的天气。
如果这还算情有可原的话,那后面的内容可就不好洗了。
首先,在我没有明确说明从哪出发的情况下,它直接给我推荐了从北京飞往日本的机票。
虽然言语间非常诚恳,甚至还表示要给我推荐大坂的租车服务。
但是有一说一,你把我 5 月 24 号的出发时间擅自改成 6 月 15 号,是不是有点不礼貌了。
其次,这次旅行的重点自然是旅游了。
于是,这个推荐的第二个项目 “ 大阪步行游 ” 成功的引起了我的好奇。
仅仅是步行,却要花费我们50美元,这是我们在大阪的步行游。难道内部有一些项目,只有那些了解的人才明白。
结果点到链接里一看,原来是悄悄给我安利了旅游跟团业务,这可就有玩 “ 植入广告 ” 的嫌疑了呀。
没想到 GPT 竟然比微软还要早一步引进商业元素,这不纯粹了呀。
当然了,在使用插件处理这种复杂问题的时候, GPT 也不总是出岔子的。
比如,这一回,我要求它根据天气给我推荐一个适合的菜谱。
虽然问题挺不着调的,但它还是给了我一个希腊沙拉的食谱。
然后在计算价格的过程上,最神奇的事情发生了。我们可以通过点击GPT提供的链接,直接进入名为instacart的购物平台。
里头关于希腊沙拉的食材全都已经加入购物车了,只要选好数量,就可以直接付款下单。
而且,在这 70 多个插件里我还发现了一个非常牛 X 的应用—— Zapier 。
Zapier是一款基于网络的自动化工具,它可以将各种应用程序连接起来,以便它们相互协作。
而现在有了 ChatGPT 的加持,直接在对话框内就能处理工作,甚至 ChatGPT 还能帮忙打打下手。
比如说有个会议需要通知员工,直接在对话框内输入要求就行。
ChatGPT 首先会生成一个 Zap 预览,并且会自动拟好邮件的内容给我们过目。
除此之外,这回一起开放的 GPT 插件中,其实还有许多神奇的小功能。
比如高分电影、书籍推荐;
你甚至还可以和它玩一款名为 Algorithma 的模拟生活的文字游戏。
粗看起来,是有点 AI 版 APP Store 的味道了。
不过,整个测试下来,差评君还是略显失望的,整个插件系统对 ChatGPT 带来的提升有,但也没有太大,并没有之前我们预期的那样,对咱们的生活带来非常明显的改变。
说到底,插件功能,其实是让 ChatGPT 对自身的一些薄弱环节进行加强,比如提升数学能力,提升数据检索能力,增加一些基本的网站操作能力等等。
但是现在测试看来,某些插件开发的不够完善,严重影响了咱们的体验,甚至给大家一种 “ 不如不更新 ” 的错觉。
差评君觉得,主要还是因为,这一回的插件功能其实是由第三方,也就是由一部分获得内测资格的开发者制作的,不免会出现水平参差不齐的问题。
然而话又说回来,在大模型即将成为平台和大基建的未来,应用生态这块儿,绝对是得迈的一道槛。
毕竟,即便强如微软,不也曾吃过生态的亏。
所以,未来 ChatGPT 在生态方面要是没有所突破的话,或者说没在应用品质上做出保证的话。
目前的领先地位,也未必不会被后来者给超越。
不过,话虽如此,但是考虑到目前 GPT 的新功能其实刚刚小范围测试,还有充裕的试错空间。
而且程序吗,哪有不出 BUG 的。
咱们不妨耐心一点, ChatGPT 宇宙可能才刚刚开始。
以上是GPT-4终于可以联网、用插件了,我用完的评价是:拉了的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

热门话题

想象一下,一个人工智能模型,不仅拥有超越传统计算的能力,还能以更低的成本实现更高效的性能。这不是科幻,DeepSeek-V2[1],全球最强开源MoE模型来了。DeepSeek-V2是一个强大的专家混合(MoE)语言模型,具有训练经济、推理高效的特点。它由236B个参数组成,其中21B个参数用于激活每个标记。与DeepSeek67B相比,DeepSeek-V2性能更强,同时节省了42.5%的训练成本,减少了93.3%的KV缓存,最大生成吞吐量提高到5.76倍。DeepSeek是一家探索通用人工智

2023年,AI技术已经成为热点话题,对各行业产生了巨大影响,编程领域尤其如此。人们越来越认识到AI技术的重要性,Spring社区也不例外。随着GenAI(GeneralArtificialIntelligence)技术的不断进步,简化具备AI功能的应用程序的创建变得至关重要和迫切。在这个背景下,"SpringAI"应运而生,旨在简化开发AI功能应用程序的过程,使其变得简单直观,避免不必要的复杂性。通过"SpringAI",开发者可以更轻松地构建具备AI功能的应用程序,将其变得更加易于使用和操作

OpenAI最近宣布推出他们的最新一代嵌入模型embeddingv3,他们声称这是性能最出色的嵌入模型,具备更高的多语言性能。这一批模型被划分为两种类型:规模较小的text-embeddings-3-small和更为强大、体积较大的text-embeddings-3-large。这些模型的设计和训练方式的信息披露得很少,模型只能通过付费API访问。所以就出现了很多开源的嵌入模型但是这些开源的模型与OpenAI闭源模型相比如何呢?本文将对这些新模型与开源模型的性能进行实证比较。我们计划建立一个数据

人形机器人Ameca升级第二代了!最近,在世界移动通信大会MWC2024上,世界上最先进机器人Ameca又现身了。会场周围,Ameca引来一大波观众。得到GPT-4加持后,Ameca能够对各种问题做出实时反应。「来一段舞蹈」。当被问及是否有情感时,Ameca用一系列的面部表情做出回应,看起来非常逼真。就在前几天,Ameca背后的英国机器人公司EngineeredArts刚刚演示了团队最新的开发成果。视频中,机器人Ameca具备了视觉能力,能看到并描述房间整个情况、描述具体物体。最厉害的是,她还能

关于Llama3,又有测试结果新鲜出炉——大模型评测社区LMSYS发布了一份大模型排行榜单,Llama3位列第五,英文单项与GPT-4并列第一。图片不同于其他Benchmark,这份榜单的依据是模型一对一battle,由全网测评者自行命题并打分。最终,Llama3取得了榜单中的第五名,排在前面的是GPT-4的三个不同版本,以及Claude3超大杯Opus。而在英文单项榜单中,Llama3反超了Claude,与GPT-4打成了平手。对于这一结果,Meta的首席科学家LeCun十分高兴,转发了推文并

如果AI模型给的答案一点也看不懂,你敢用吗?随着机器学习系统在更重要的领域得到应用,证明为什么我们可以信任它们的输出,并明确何时不应信任它们,变得越来越重要。获得对复杂系统输出结果信任的一个可行方法是,要求系统对其输出产生一种解释,这种解释对人类或另一个受信任的系统来说是可读的,即可以完全理解以至于任何可能的错误都可以被发现。例如,为了建立对司法系统的信任,我们要求法院提供清晰易读的书面意见,解释并支持其决策。对于大型语言模型来说,我们也可以采用类似的方法。不过,在采用这种方法时,确保语言模型生

作者丨TimAnderson编译丨诺亚出品|51CTO技术栈(微信号:blog51cto)Zed编辑器项目目前仍处于预发布阶段,已在AGPL、GPL和Apache许可下开源。该编辑器以高性能和多种AI辅助选择为特色,但目前仅适用于Mac平台使用。内森·索博(NathanSobo)在一篇帖子中解释道,Zed项目在GitHub上的代码库中,编辑器部分采用了GPL许可,服务器端组件则使用了AGPL许可证,而GPUI(GPU加速用户界面)部分则采用了Apache2.0许可。GPUI是Zed团队开发的一款

卷疯了卷疯了,大模型又变天了。就在刚刚,全球最强AI模型一夜易主,GPT-4被拉下神坛。Anthropic发布了最新的Claude3系列模型,一句话评价:真·全面碾压GPT-4!多模态和语言能力指标上,Claude3都赢麻了。用Anthropic的话说,Claude3系列模型在推理、数学、编码、多语言理解和视觉方面,都树立了新的行业基准!Anthropic,就是曾因安全理念不合,而从OpenAI「叛逃」出的员工组成的初创公司,他们的产品一再给OpenAI暴击。这次的Claude3,更是整了个大的
