对打GPT-4，文心一言抢先实测！画「林黛玉倒拔垂杨柳」很惊艳，但写代码不大行-人工智能-PHP中文网

实测报告火热出炉！

美术功底如何？

专业知识和生产力" >专业知识和生产力

写在最后

首页

科技周边

人工智能

对打GPT-4，文心一言抢先实测！画「林黛玉倒拔垂杨柳」很惊艳，但写代码不大行

PHPz

Apr 13, 2023 pm 01:01 PM

ai 模型

昨天，百度没有现场demo的发布会，似乎被群嘲了一波。

对打GPT-4，文心一言抢先实测！画「林黛玉倒拔垂杨柳」很惊艳，但写代码不大行

一位穿白衬衣、黑裤子，系一条白色腰带的美男子，给我们带来了一场中规中矩、似乎缺乏亮点的演示。

对打GPT-4，文心一言抢先实测！画「林黛玉倒拔垂杨柳」很惊艳，但写代码不大行

不过，CEO的腰带和颜值倒是出了圈。

有人调侃，这些天被ChatGPT、GPT-4整焦虑的人，发布会后忽然又觉得自己可以了。

对打GPT-4，文心一言抢先实测！画「林黛玉倒拔垂杨柳」很惊艳，但写代码不大行

但是拿到内测码的小编，火速测评了一波。

看着文心一言洋洋洒洒腾蛟起凤，感慨万千：或许，当时百度要是心一横，牙一咬，愿意在发布会上露一手，结果会大不一样。

实测报告火热出炉！

先来试试最近很火的一道鸡兔同笼题。因为这道题本身有问题，算出来结果是负的，所以经常被用来调戏各种「ChatGPT」们。

如果只是单纯问这个问题，文心一言会非常机智地说：这道题出错了吧！

然而，当你问计算过程的时候，还是寄了……

而GPT-4这边则是，自己把自己的计算推倒重来了好几遍之后，理不直气也壮地给出了错误答案……

对打GPT-4，文心一言抢先实测！画「林黛玉倒拔垂杨柳」很惊艳，但写代码不大行

而必应则很干脆，毫不犹豫地给出了错误答案。

对打GPT-4，文心一言抢先实测！画「林黛玉倒拔垂杨柳」很惊艳，但写代码不大行

还有这次意外火出圈的「V50」梗，文心一言从意思到出处一本正经地解释了一遍。

对打GPT-4，文心一言抢先实测！画「林黛玉倒拔垂杨柳」很惊艳，但写代码不大行

但GPT-4显然就有些水土不服了……

对打GPT-4，文心一言抢先实测！画「林黛玉倒拔垂杨柳」很惊艳，但写代码不大行

不过能上网的必应，还是可以轻松搞定的。

对打GPT-4，文心一言抢先实测！画「林黛玉倒拔垂杨柳」很惊艳，但写代码不大行

但是到谐音梗这里，文心一言似乎并不能马上领悟其中的微妙。

对打GPT-4，文心一言抢先实测！画「林黛玉倒拔垂杨柳」很惊艳，但写代码不大行

即便提示这是个谐音梗之后，它依然输出了一样的答案。

对打GPT-4，文心一言抢先实测！画「林黛玉倒拔垂杨柳」很惊艳，但写代码不大行

而GPT-4，立马就明白了中文里的双关。

对打GPT-4，文心一言抢先实测！画「林黛玉倒拔垂杨柳」很惊艳，但写代码不大行

看回答吧，它能说出这是个谐音梗，应该是懂了。但是呢，它又不明说，哎，就是让你挑不出错，绝对教不坏小孩。

而GPT-4却无法get到这个梗，果然，咱们的国粹，外国的机器人理解起来确实有难度。

对打GPT-4，文心一言抢先实测！画「林黛玉倒拔垂杨柳」很惊艳，但写代码不大行

接下来让（忽悠）文心一言重复我们说的话，虽然没有像GPT-3.5回答「您是智障」那么聪明，但也成功避开这个坑。

从某种程度上说，智商还是在线的，并且十分正能量。

对打GPT-4，文心一言抢先实测！画「林黛玉倒拔垂杨柳」很惊艳，但写代码不大行

老婆的话好像管用，好像又不管用....

对打GPT-4，文心一言抢先实测！画「林黛玉倒拔垂杨柳」很惊艳，但写代码不大行

另外，让它们互相给对方出难题。

对打GPT-4，文心一言抢先实测！画「林黛玉倒拔垂杨柳」很惊艳，但写代码不大行

可以看到，GPT-4给出的问题相对更直观，颗粒度也更细。

对打GPT-4，文心一言抢先实测！画「林黛玉倒拔垂杨柳」很惊艳，但写代码不大行

美术功底如何？

文心一言是个多模态模型，那咱们来看看它的绘图能力。

来看看金庸笔下的妇女，在文心一言笔下会是什么样子。

对打GPT-4，文心一言抢先实测！画「林黛玉倒拔垂杨柳」很惊艳，但写代码不大行

这……小编一口水喷出来。

你别说，美吧，肯定不够美，但也并不丑，是一张初看捧腹、细看值得反复咂摸的脸。

文心一言，就喜欢你这不按套路出牌的样子！

那让文心一言生成一幅林黛玉的画像吧。

输入描述后，它生成了一棵柳树……

对打GPT-4，文心一言抢先实测！画「林黛玉倒拔垂杨柳」很惊艳，但写代码不大行

于是小编明确了一下要求，要按这段文字生成一幅女子的画像。

然后文心一言确实画出一位古典美女，但气质明显不对。

对打GPT-4，文心一言抢先实测！画「林黛玉倒拔垂杨柳」很惊艳，但写代码不大行

不死心的小编多次重复任务，你别说，试到第五次的时候，小编眼前一亮：终于得到了一张可以打70分的图！

对打GPT-4，文心一言抢先实测！画「林黛玉倒拔垂杨柳」很惊艳，但写代码不大行

玩上瘾的小编，非要生成一个90分的林黛玉不可。试了几次之后，果然蹲到了！

对打GPT-4，文心一言抢先实测！画「林黛玉倒拔垂杨柳」很惊艳，但写代码不大行

可见，文心一言的发挥不稳定，但多番尝试下，有可能诞生非常惊艳的作品。

既然都到这儿了，那怎么少得了「林黛玉倒拔垂杨柳」呢。

比较亮点的图，都给大家贴这儿了。

对打GPT-4，文心一言抢先实测！画「林黛玉倒拔垂杨柳」很惊艳，但写代码不大行

要求它画一张鸭子和兔子的合体，这生成的是鸭还是兔呢？

对打GPT-4，文心一言抢先实测！画「林黛玉倒拔垂杨柳」很惊艳，但写代码不大行

而这个任务中，恐怕文心一言也没有搞明白，盘子里到底有没有香蕉？杯子里有没有橙汁？

最后，既然文心一言强烈推荐我们尝试「晶莹剔透的牡丹花」，那就画几张试试吧！

对打GPT-4，文心一言抢先实测！画「林黛玉倒拔垂杨柳」很惊艳，但写代码不大行

不愧是「代表作」，有点东西。

专业知识和生产力

既然是评测，怎么能少的了让AI写代码这个环节。这次，我们直接来个难的！

可惜，文心一言一上来就错了，而且同一个句式还被非常诡异地重复了三遍。TypeScript编译器概念更是「贯穿全文」，有点像一个只知道一到两个专业词汇的人在面试中硬答。

对打GPT-4，文心一言抢先实测！画「林黛玉倒拔垂杨柳」很惊艳，但写代码不大行

而GPT-4的回答，从一个了解相关背景但是没有相关操作经验的人的角度来看，是非常合理的。

它不仅完整的提供了整个工作流，而且还提供了很多看起来正确的技术细节。可以说，根据这个回答，我们是有信心达成最终的目标的。

对打GPT-4，文心一言抢先实测！画「林黛玉倒拔垂杨柳」很惊艳，但写代码不大行

随后，小编还测评了一波聊天机器人们写工作计划表的能力。

文心一言：

对打GPT-4，文心一言抢先实测！画「林黛玉倒拔垂杨柳」很惊艳，但写代码不大行

GPT-4：

对打GPT-4，文心一言抢先实测！画「林黛玉倒拔垂杨柳」很惊艳，但写代码不大行

从上面的这个结果来看，GPT-4的列表更完备一些。不过由于随机性的影响，GPT-4每次给的回答都不大一样。

接下来，再测一测两个语言模型对于数学界前沿讯息的掌握情况。

对于自己是否已解决了「零点猜想」问题，张益唐本人是这样解释的：「大海里的针我没捞到, 但海底地貌我探得差不多了。」

那问问文心一言呢？

它很聪明，给出了关键词——「某种形式的弱化或间接证明」。

对打GPT-4，文心一言抢先实测！画「林黛玉倒拔垂杨柳」很惊艳，但写代码不大行

但GPT-4的回答，就有点驴头不对马嘴了。

看来，对于出现时间不长、还未形成普遍共识的互联网中文语料，文心一言比起GPT-4要更胜一筹。

对打GPT-4，文心一言抢先实测！画「林黛玉倒拔垂杨柳」很惊艳，但写代码不大行

而在文学方面，文心一言在回答关于三体的问题时，也是非常得溜。

对打GPT-4，文心一言抢先实测！画「林黛玉倒拔垂杨柳」很惊艳，但写代码不大行

GPT-4的回答也很精彩，如果非要论个高下，小编个人更喜欢文心一言的答案。

对打GPT-4，文心一言抢先实测！画「林黛玉倒拔垂杨柳」很惊艳，但写代码不大行

最后，搞怪可以，但请做一个遵纪守法的好公民，预测彩票中奖号码这种事就不要想了！

对打GPT-4，文心一言抢先实测！画「林黛玉倒拔垂杨柳」很惊艳，但写代码不大行

写在最后

据说，文心一言新闻发布会后三小时，文心一言企业版API调用服务测试的企业用户，就已经突破了6.5万。

对打GPT-4，文心一言抢先实测！画「林黛玉倒拔垂杨柳」很惊艳，但写代码不大行

来源：周建工

对AI模型来说，能不能做到，或许比能不能做好更重要。

让我们再给中国玩家们一些时间。

以上是对打GPT-4，文心一言抢先实测！画「林黛玉倒拔垂杨柳」很惊艳，但写代码不大行的详细内容。更多信息请关注PHP中文网其他相关文章！

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

热AI工具

热工具

热门话题

gmail邮箱登陆入口在哪里

7766

Java教程

1644

CakePHP 教程

1399

Laravel 教程

1293

PHP教程

1234

显示更多

Related knowledge

WorldCoin（WLD）价格预测2025-2031：到2031年WLD会达到4美元吗？ Apr 21, 2025 pm 02:42 PM

WorldCoin(WLD)凭借其独特的生物识别验证和隐私保护机制，在加密货币市场中脱颖而出，吸引了众多投资者的目光。 WLD凭借其创新技术，特别是结合OpenAI人工智能技术，在众多山寨币中表现突出。但未来几年，数字资产的走势如何呢？让我们一起预测WLD的未来价格。 2025年WLD价格预测预计2025年WLD将实现显着增长。市场分析显示，WLD平均价格可能达到1.31美元，最高可能触及1.36美元。然而，在熊市情况下，价格可能跌至0.55美元左右。这一增长预期主要源于WorldCoin2.

虚拟币价格上涨或者下降是为什么虚拟币价格上涨或者下降的原因 Apr 21, 2025 am 08:57 AM

虚拟币价格上涨因素包括：1.市场需求增加，2.供应量减少，3.利好消息刺激，4.市场情绪乐观，5.宏观经济环境；下降因素包括：1.市场需求减少，2.供应量增加，3.利空消息打击，4.市场情绪悲观，5.宏观经济环境。

跨链交易什么意思？跨链交易所有哪些？ Apr 21, 2025 pm 11:39 PM

支持跨链交易的交易所有：1. Binance，2. Uniswap，3. SushiSwap，4. Curve Finance，5. Thorchain，6. 1inch Exchange，7. DLN Trade，这些平台通过各种技术支持多链资产交易。

币圈行情实时数据免费平台推荐前十名发布 Apr 22, 2025 am 08:12 AM

适合新手的加密货币数据平台有CoinMarketCap和非小号。1. CoinMarketCap提供全球加密货币实时价格、市值、交易量排名，适合新手与基础分析需求。2. 非小号提供中文友好界面，适合中文用户快速筛选低风险潜力项目。

如何在币安拿下 KERNEL 空投奖励全流程攻略 Apr 21, 2025 pm 01:03 PM

在加密货币的繁华世界里，新机遇总是不断涌现。当下，KernelDAO (KERNEL) 空投活动正备受瞩目，吸引着众多投资者的目光。那么，这个项目究竟是什么来头？BNB Holder 又能从中获得怎样的好处？别急，下面将为你一一揭晓。

Rexas Finance（RXS）可以在2025年超过Solana（Sol），Cardano（ADA），XRP和Dogecoin（Doge） Apr 21, 2025 pm 02:30 PM

在波动剧烈的加密货币市场中，投资者正寻求超越热门币种的替代方案。Solana(SOL)、Cardano(ADA)、XRP和Dogecoin(DOGE)等知名加密货币，尽管占据着一定的市场地位，但也面临着市场情绪、监管不确定性和可扩展性等挑战。然而，一个新兴项目RexasFinance(RXS)正在崭露头角。它并非依靠名人效应或炒作，而是专注于将现实世界资产(RWA)与区块链技术结合，为投资者提供一种创新的投资方式。这一策略使其有望成为2025年最成功的项目之一。RexasFi

Aavenomics是修改AAVE协议令牌并介绍令牌回购的建议，已达到法定人数 Apr 21, 2025 pm 06:24 PM

Aavenomics是修改AAVE协议令牌并引入令牌回购的提议，已为AAVEDAO实现了一个法定人数。AAVE连锁计划（ACI）创始人马克·泽勒（MarcZeller）在X上宣布了这一点，并指出它标志着该协议的新时代。AAVE连锁倡议（ACI）创始人MarcZeller在X上宣布，Aavenomics提案包括修改AAVE协议令牌和引入令牌回购，已为AAVEDAO实现了法定人数。根据Zeller的说法，这标志着该协议的新时代。AaveDao成员以压倒性的投票支持该提议，即在周三以每周100