对打GPT-4,文心一言抢先实测!画「林黛玉倒拔垂杨柳」很惊艳,但写代码不大行
昨天,百度没有现场demo的发布会,似乎被群嘲了一波。
一位穿白衬衣、黑裤子,系一条白色腰带的美男子,给我们带来了一场中规中矩、似乎缺乏亮点的演示。
不过,CEO的腰带和颜值倒是出了圈。
有人调侃,这些天被ChatGPT、GPT-4整焦虑的人,发布会后忽然又觉得自己可以了。
但是拿到内测码的小编,火速测评了一波。
看着文心一言洋洋洒洒腾蛟起凤,感慨万千:或许,当时百度要是心一横,牙一咬,愿意在发布会上露一手,结果会大不一样。
实测报告火热出炉!
先来试试最近很火的一道鸡兔同笼题。因为这道题本身有问题,算出来结果是负的,所以经常被用来调戏各种「ChatGPT」们。
如果只是单纯问这个问题,文心一言会非常机智地说:这道题出错了吧!
然而,当你问计算过程的时候,还是寄了……
而GPT-4这边则是,自己把自己的计算推倒重来了好几遍之后,理不直气也壮地给出了错误答案……
而必应则很干脆,毫不犹豫地给出了错误答案。
还有这次意外火出圈的「V50」梗,文心一言从意思到出处一本正经地解释了一遍。
但GPT-4显然就有些水土不服了……
不过能上网的必应,还是可以轻松搞定的。
但是到谐音梗这里,文心一言似乎并不能马上领悟其中的微妙。
即便提示这是个谐音梗之后,它依然输出了一样的答案。
而GPT-4,立马就明白了中文里的双关。
看回答吧,它能说出这是个谐音梗,应该是懂了。但是呢,它又不明说,哎,就是让你挑不出错,绝对教不坏小孩。
而GPT-4却无法get到这个梗,果然,咱们的国粹,外国的机器人理解起来确实有难度。
接下来让(忽悠)文心一言重复我们说的话,虽然没有像GPT-3.5回答「您是智障」那么聪明,但也成功避开这个坑。
从某种程度上说,智商还是在线的,并且十分正能量。
老婆的话好像管用,好像又不管用....
另外,让它们互相给对方出难题。
可以看到,GPT-4给出的问题相对更直观,颗粒度也更细。
美术功底如何?
文心一言是个多模态模型,那咱们来看看它的绘图能力。
来看看金庸笔下的妇女,在文心一言笔下会是什么样子。
这……小编一口水喷出来。
你别说,美吧,肯定不够美,但也并不丑,是一张初看捧腹、细看值得反复咂摸的脸。
文心一言,就喜欢你这不按套路出牌的样子!
那让文心一言生成一幅林黛玉的画像吧。
输入描述后,它生成了一棵柳树……
于是小编明确了一下要求,要按这段文字生成一幅女子的画像。
然后文心一言确实画出一位古典美女,但气质明显不对。
不死心的小编多次重复任务,你别说,试到第五次的时候,小编眼前一亮:终于得到了一张可以打70分的图!
玩上瘾的小编,非要生成一个90分的林黛玉不可。试了几次之后,果然蹲到了!
可见,文心一言的发挥不稳定,但多番尝试下,有可能诞生非常惊艳的作品。
既然都到这儿了,那怎么少得了「林黛玉倒拔垂杨柳」呢。
比较亮点的图,都给大家贴这儿了。
要求它画一张鸭子和兔子的合体,这生成的是鸭还是兔呢?
而这个任务中,恐怕文心一言也没有搞明白,盘子里到底有没有香蕉?杯子里有没有橙汁?
最后,既然文心一言强烈推荐我们尝试「晶莹剔透的牡丹花」,那就画几张试试吧!
不愧是「代表作」,有点东西。
专业知识和生产力
既然是评测,怎么能少的了让AI写代码这个环节。这次,我们直接来个难的!
可惜,文心一言一上来就错了,而且同一个句式还被非常诡异地重复了三遍。TypeScript编译器概念更是「贯穿全文」,有点像一个只知道一到两个专业词汇的人在面试中硬答。
而GPT-4的回答,从一个了解相关背景但是没有相关操作经验的人的角度来看,是非常合理的。
它不仅完整的提供了整个工作流,而且还提供了很多看起来正确的技术细节。可以说,根据这个回答,我们是有信心达成最终的目标的。
随后,小编还测评了一波聊天机器人们写工作计划表的能力。
文心一言:
GPT-4:
从上面的这个结果来看,GPT-4的列表更完备一些。不过由于随机性的影响,GPT-4每次给的回答都不大一样。
接下来,再测一测两个语言模型对于数学界前沿讯息的掌握情况。
对于自己是否已解决了「零点猜想」问题,张益唐本人是这样解释的:「大海里的针我没捞到, 但海底地貌我探得差不多了。」
那问问文心一言呢?
它很聪明,给出了关键词——「某种形式的弱化或间接证明」。
但GPT-4的回答,就有点驴头不对马嘴了。
看来,对于出现时间不长、还未形成普遍共识的互联网中文语料,文心一言比起GPT-4要更胜一筹。
而在文学方面,文心一言在回答关于三体的问题时,也是非常得溜。
GPT-4的回答也很精彩,如果非要论个高下,小编个人更喜欢文心一言的答案。
最后,搞怪可以,但请做一个遵纪守法的好公民,预测彩票中奖号码这种事就不要想了!
写在最后
据说,文心一言新闻发布会后三小时,文心一言企业版API调用服务测试的企业用户,就已经突破了6.5万。
来源:周建工
对AI模型来说,能不能做到,或许比能不能做好更重要。
让我们再给中国玩家们一些时间。
以上是对打GPT-4,文心一言抢先实测!画「林黛玉倒拔垂杨柳」很惊艳,但写代码不大行的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

WorldCoin(WLD)凭借其独特的生物识别验证和隐私保护机制,在加密货币市场中脱颖而出,吸引了众多投资者的目光。 WLD凭借其创新技术,特别是结合OpenAI人工智能技术,在众多山寨币中表现突出。但未来几年,数字资产的走势如何呢?让我们一起预测WLD的未来价格。 2025年WLD价格预测预计2025年WLD将实现显着增长。市场分析显示,WLD平均价格可能达到1.31美元,最高可能触及1.36美元。然而,在熊市情况下,价格可能跌至0.55美元左右。这一增长预期主要源于WorldCoin2.

虚拟币价格上涨因素包括:1.市场需求增加,2.供应量减少,3.利好消息刺激,4.市场情绪乐观,5.宏观经济环境;下降因素包括:1.市场需求减少,2.供应量增加,3.利空消息打击,4.市场情绪悲观,5.宏观经济环境。

支持跨链交易的交易所有:1. Binance,2. Uniswap,3. SushiSwap,4. Curve Finance,5. Thorchain,6. 1inch Exchange,7. DLN Trade,这些平台通过各种技术支持多链资产交易。

适合新手的加密货币数据平台有CoinMarketCap和非小号。1. CoinMarketCap提供全球加密货币实时价格、市值、交易量排名,适合新手与基础分析需求。2. 非小号提供中文友好界面,适合中文用户快速筛选低风险潜力项目。

在加密货币的繁华世界里,新机遇总是不断涌现。当下,KernelDAO (KERNEL) 空投活动正备受瞩目,吸引着众多投资者的目光。那么,这个项目究竟是什么来头?BNB Holder 又能从中获得怎样的好处?别急,下面将为你一一揭晓。

在波动剧烈的加密货币市场中,投资者正寻求超越热门币种的替代方案。Solana(SOL)、Cardano(ADA)、XRP和Dogecoin(DOGE)等知名加密货币,尽管占据着一定的市场地位,但也面临着市场情绪、监管不确定性和可扩展性等挑战。然而,一个新兴项目RexasFinance(RXS)正在崭露头角。它并非依靠名人效应或炒作,而是专注于将现实世界资产(RWA)与区块链技术结合,为投资者提供一种创新的投资方式。这一策略使其有望成为2025年最成功的项目之一。RexasFi

Aavenomics是修改AAVE协议令牌并引入令牌回购的提议,已为AAVEDAO实现了一个法定人数。AAVE连锁计划(ACI)创始人马克·泽勒(MarcZeller)在X上宣布了这一点,并指出它标志着该协议的新时代。AAVE连锁倡议(ACI)创始人MarcZeller在X上宣布,Aavenomics提案包括修改AAVE协议令牌和引入令牌回购,已为AAVEDAO实现了法定人数。根据Zeller的说法,这标志着该协议的新时代。AaveDao成员以压倒性的投票支持该提议,即在周三以每周100

绘制比特币结构分析图的步骤包括:1. 确定绘图目的与受众,2. 选择合适的工具,3. 设计框架并填充核心组件,4. 参考现有模板。完整的步骤确保图表准确且易于理解。
