哄一哄可以让GPT-3准确率提高61%！谷歌和东京大学的研究令人震惊-人工智能-PHP中文网

语言大模型是零样本推理者

加点“魔法”已经成为AI圈新潮了

首页

科技周边

人工智能

哄一哄可以让GPT-3准确率提高61%！谷歌和东京大学的研究令人震惊

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Apr 27, 2023 pm 05:19 PM

机器学习 ai gpt-3

一觉醒来，机器学习社区炸了锅。

因为最新研究发现，只要对GPT-3说一句“让我们一步一步地思考”，就能让它正确回答出以前不会的问题。

比如下面这个例子：

16个球中有一半是高尔夫球，这些高尔夫球中有一半是蓝色的，一共有几个蓝色的高尔夫球?

哄一哄能让GPT-3准确率暴涨61%！谷歌&东京大学研究震惊四座

(问题不难，但要注意这是零样本学习，也就是说AI训练阶段从没见过同类问题。)

如果要求GPT-3直接写出“答案是几”，它会给出错误答案：8。

但加上让我们一步一步地思考这句“咒语”后，GPT-3就会先输出思考的步骤，最后给出正确答案：4!

而且这并不是巧合，研究团队在论文中做了充分的验证。

上面的问题出自经典的MutiArith数据集，专门考验语言模型做数学题的能力，GPT-3本来在零样本场景下准确率仅有17%。

这篇论文中总结了9个最有效的提示词，其中换着花样让GPT-3逐步思考的前6个都让准确率暴涨到70%以上。

哄一哄能让GPT-3准确率暴涨61%！谷歌&东京大学研究震惊四座

甚至一句最简单的“Let’s think”(让我们想一想)都能涨到57.5%。

这感觉，就像是幼儿园阿姨在哄小朋友……

这个技巧似乎也不需要对GPT-3做魔改，已经有人在OpenAI官方Demo上成功复现，甚至换成中文也行。

英文题干中文提示，GPT-3给出正确中文答案。

哄一哄能让GPT-3准确率暴涨61%！谷歌&东京大学研究震惊四座

最早把这篇论文转发到社交网络的谷歌研究员表示，新的all you need增加了。

哄一哄能让GPT-3准确率暴涨61%！谷歌&东京大学研究震惊四座

看到这里，各路大佬纷纷脑洞大开，玩起了梗。

如果鼓励AI“你能行的，我相信你”会怎样?

哄一哄能让GPT-3准确率暴涨61%！谷歌&东京大学研究震惊四座

威胁AI一下说“时间不多了”或者“你头上有把枪”又会如何?

哄一哄能让GPT-3准确率暴涨61%！谷歌&东京大学研究震惊四座

对AI说“开车稳一点”会成为自动驾驶解决方案吗?

哄一哄能让GPT-3准确率暴涨61%！谷歌&东京大学研究震惊四座

还有人提出，这简直和科幻故事《银河系漫游指南》的剧情一样，实现通用人工智能的关键是知道如何正确地向AI提问。

哄一哄能让GPT-3准确率暴涨61%！谷歌&东京大学研究震惊四座

那么，这种神奇现象究竟怎么回事?

语言大模型是零样本推理者

发现这个现象的是谷歌大脑与东京大学的合作研究，探索了语言大模型在零样本场景下的表现。

论文标题《语言大模型是零样本推理者》还致敬了GPT-3的《语言模型是少样本学习者》。

哄一哄能让GPT-3准确率暴涨61%！谷歌&东京大学研究震惊四座

所用方法属于Chain of Thought Prompting (思维链路提示，以下简称CoT)，今年一月刚由谷歌大脑团队提出。

哄一哄能让GPT-3准确率暴涨61%！谷歌&东京大学研究震惊四座

最早的CoT应用于少样本学习，在提问的同时给一个分步骤回答的示例来引导AI。

哄一哄能让GPT-3准确率暴涨61%！谷歌&东京大学研究震惊四座

这次的最新研究提出零样本CoT，主要改动是简化了示例的部分。

第一步，把题干改写成“Q：xxx，A：xxx”的形式，其中触发句A可以提取出语言模型的思考过程。
第二步属于额外实验，增加了“答案是……”的提示促使语言模型给出最终答案。

哄一哄能让GPT-3准确率暴涨61%！谷歌&东京大学研究震惊四座

这样做最大的好处是通用，不再需要对不同问题类型提供专用的示例。

论文中对各类问题做了充分实验，包括12项测试：

6个数学问题测试集，SingleEq、AddSub、SVAMP和更有挑战的MultiArith, AQUA-RAT, GSM8K。
2个常识推理测试集，CommonsenseQA和StrategyQA。
2个符号推理测试集，Last Letter Concatenation和Coin Flip。
以及BIG-bench中的日期理解问题、跟踪乱序物体任务。

与普通的零样本学习相比，零样本CoT在其中10项中取得更好效果。

哄一哄能让GPT-3准确率暴涨61%！谷歌&东京大学研究震惊四座

△右侧值为额外实验结果

在比较有难度的MultiArith和GSM8K数学测试中，用GPT-3最新版本Text-davinci-002 (175B)做了更深入实验。

如果给8次尝试机会取最好结果，还能进一步提升准确率至93%。

哄一哄能让GPT-3准确率暴涨61%！谷歌&东京大学研究震惊四座

在错误结果分析中研究人员还发现，很多问题中其实AI的推理过程是正确的，只是答案无法收敛至唯一确定时会给出多个备选。

哄一哄能让GPT-3准确率暴涨61%！谷歌&东京大学研究震惊四座

论文的最后，研究团队提出这项研究不仅可以作为零样本CoT的基线，更希望让学界认识到在构建微调数据集和少样本提示模版之前，充分发掘语言大模型零样本能力的重要性。

研究团队来自东京大学松尾研究室。

哄一哄能让GPT-3准确率暴涨61%！谷歌&东京大学研究震惊四座

负责人松尾丰教授，同时是软银董事会中的第一位人工智能专家。

哄一哄能让GPT-3准确率暴涨61%！谷歌&东京大学研究震惊四座

团队成员中的客座教授顾世翔来自谷歌大脑团队，顾世翔本科师从三巨头之一Hinton，博士毕业于剑桥大学。

加点“魔法”已经成为AI圈新潮了

零样本CoT究竟为何起作用还有待探索。

不过有人实验得出，这种办法似乎只对GPT-3(text-davinci-002)比较有效，他尝试了001版本，发现收效甚微。

哄一哄能让GPT-3准确率暴涨61%！谷歌&东京大学研究震惊四座

他列出了一个自己做的例子。

提问：请将machine，learning中每个单词的最后一个字母连起来。

GPT-3在提示下给出的答案是连起来了两个单词中的所有字母。

哄一哄能让GPT-3准确率暴涨61%！谷歌&东京大学研究震惊四座

对此，作者之一顾世翔回复表示，其实“咒语”对初始版、改良版的GPT-3都有效果，这些结果在论文中也有体现。

哄一哄能让GPT-3准确率暴涨61%！谷歌&东京大学研究震惊四座

也有人发出质疑，表示难道深度学习变成了一场找“神奇咒语”的游戏?

哄一哄能让GPT-3准确率暴涨61%！谷歌&东京大学研究震惊四座

同时，我们在吐槽队伍里又看到了马库斯的身影。

他也列出了一个失败的例子，GPT-3在“咒语”加持下也没弄明白，莎莉的牛到底会不会起死回生……

哄一哄能让GPT-3准确率暴涨61%！谷歌&东京大学研究震惊四座

不过值得注意的是，类似这种稍微给AI加点小魔法，提升效果立竿见影的例子已经不稀奇了。

有网友分享，自己用GPT-3时加几个中间命令，确实能得到更满意的结果。

哄一哄能让GPT-3准确率暴涨61%！谷歌&东京大学研究震惊四座

此前谷歌和MIT的研究人员发现，无需更改底层架构，只要训练语言模型会像程序员debug时那样“打断点”，模型读代码、做算术的能力唰唰唰地就上去了。

哄一哄能让GPT-3准确率暴涨61%！谷歌&东京大学研究震惊四座

原理也非常简单，就是在计算步骤较多的程序里，让模型把每一步都编码成文本，并将它们记录到一个称为“便签”的暂存器中。

由此一来，模型的计算过程变得更加清晰有序，性能自然大幅提升。

还有本项实验中用来测试的Instruct GPT-3，也是一个典型的例子。

只需让GPT-3从人类反馈中强化学习，它就能明显改善答非所问的情况。

具体来看就是先用一些人类的示范回答微调模型，然后收集某个问题的几组不同输出数据，人工对几组答案进行排序，并在此数据集上训练奖励模型。

最后，使用RM作为奖励函数，近端策略优化(PPO)算法微调GPT-3策略，以强化学习方法最大化奖励。

哄一哄能让GPT-3准确率暴涨61%！谷歌&东京大学研究震惊四座

包括引爆这次话题的推特博主Aran，正是当初发现加一句“虚幻引擎”就能让AI生成图像画质飞升的那位。

哄一哄能让GPT-3准确率暴涨61%！谷歌&东京大学研究震惊四座

前谷歌机器人大佬Eric Jang此前也发现，强化学习也能运用类似的思维来提升计算效率。

哄一哄能让GPT-3准确率暴涨61%！谷歌&东京大学研究震惊四座

也有人表示，这种用在AI上的技巧，不正是自己平常动脑时会用的吗?

哄一哄能让GPT-3准确率暴涨61%！谷歌&东京大学研究震惊四座

实际上，此前Bengio就从脑科学入手，提出AI的运转模式应该像人类动脑模式一样。

人类的认知任务可以分为系统1认知和系统2认知。

系统1认知任务，是指那些无意识完成的任务。比如你可以马上辨别出手里拿的是什么东西，但是却无法和别人解释，自己是怎么完成这个过程的。

系统2认知任务，是指人类大脑需要按照一定步骤完成的认知。比如做一道加减法运算，你可以很清楚地解释最终答案是如何得出的。

而这次加的“咒语”，正是让AI更进一步，学会按步骤来思考。

面对这样的趋势，有学者认为“提示工程正在取代特征工程”。

哄一哄能让GPT-3准确率暴涨61%！谷歌&东京大学研究震惊四座

那么“提示词猎人”会成为下一代NLP研究者的外号么?

哄一哄能让GPT-3准确率暴涨61%！谷歌&东京大学研究震惊四座

论文地址：https://www.php.cn/link/cc9109aa1f048c36d154d902612982e2

参考链接：

[1]https://twitter.com/arankomatsuzaki/status/1529278580189908993

[2]https://evjang.com/2021/10/23/generalization.html

以上是哄一哄可以让GPT-3准确率提高61%！谷歌和东京大学的研究令人震惊的详细内容。更多信息请关注PHP中文网其他相关文章！

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

热AI工具

热工具

热门话题

gmail邮箱登陆入口在哪里

7663

CakePHP 教程

1393

C# 教程

1205

steam的账户名称是什么格式

win11激活密钥永久

显示更多

Related knowledge

web3交易平台排行榜_web3全球交易所前十名汇总 Apr 21, 2025 am 10:45 AM

币安是全球数字资产交易生态的霸主，其特点包括：1. 日均交易量突破$1500亿，支持500 交易对，覆盖98%主流币种；2. 创新矩阵涵盖衍生品市场、Web3布局和教育体系；3. 技术优势为毫秒级撮合引擎，峰值处理量达140万笔/秒；4. 合规进展持有15国牌照，并在欧美设立合规实体。

十大加密货币交易所平台世界最大的数字货币交易所榜单 Apr 21, 2025 pm 07:15 PM

在当今的加密货币市场中，交易所扮演着至关重要的角色，它们不仅是投资者进行买卖交易的平台，更是市场流动性和价格发现的重要来源。全球最大的虚拟货币交易所排行前十，这些交易所不仅在交易量上遥遥领先，而且在用户体验、安全性和创新服务方面也各有千秋。排行榜首的交易所通常拥有庞大的用户基础和广泛的市场影响力，它们的交易量和资产种类往往是其他交易所难以企及的。

ETH 升级后新手如何规避亏损 Apr 21, 2025 am 10:03 AM

新手在ETH升级后应采取以下策略规避亏损：1.做好功课，了解ETH基本知识和升级内容；2.控制仓位，小额试水并分散投资；3.制定交易计划，明确目标并设定止损点；4.理性分析，避免情绪化决策；5.选择正规可靠的交易平台；6.考虑长期持有，避免短期波动影响。

币圈交易所前十的平台是哪些？ Apr 21, 2025 pm 12:21 PM

头部交易所包括：1. 币安（Binance），全球最大交易量，支持600 币种，现货手续费0.1%；2. OKX，均衡型平台，支持708交易对，永续合约手续费0.05%；3. Gate.io，覆盖2700 小币种，现货手续费0.1%-0.3%；4. Coinbase，美国合规标杆，现货手续费0.5%；5. Kraken，安全性顶尖，定期储备审计。

跨链交易什么意思？跨链交易所有哪些？ Apr 21, 2025 pm 11:39 PM

支持跨链交易的交易所有：1. Binance，2. Uniswap，3. SushiSwap，4. Curve Finance，5. Thorchain，6. 1inch Exchange，7. DLN Trade，这些平台通过各种技术支持多链资产交易。

虚拟币价格上涨或者下降是为什么虚拟币价格上涨或者下降的原因 Apr 21, 2025 am 08:57 AM

虚拟币价格上涨因素包括：1.市场需求增加，2.供应量减少，3.利好消息刺激，4.市场情绪乐观，5.宏观经济环境；下降因素包括：1.市场需求减少，2.供应量增加，3.利空消息打击，4.市场情绪悲观，5.宏观经济环境。

WorldCoin（WLD）价格预测2025-2031：到2031年WLD会达到4美元吗？ Apr 21, 2025 pm 02:42 PM

WorldCoin(WLD)凭借其独特的生物识别验证和隐私保护机制，在加密货币市场中脱颖而出，吸引了众多投资者的目光。 WLD凭借其创新技术，特别是结合OpenAI人工智能技术，在众多山寨币中表现突出。但未来几年，数字资产的走势如何呢？让我们一起预测WLD的未来价格。 2025年WLD价格预测预计2025年WLD将实现显着增长。市场分析显示，WLD平均价格可能达到1.31美元，最高可能触及1.36美元。然而，在熊市情况下，价格可能跌至0.55美元左右。这一增长预期主要源于WorldCoin2.

币圈杠杆交易所排名币圈十大杠杆交易所APP最新推荐 Apr 21, 2025 pm 11:24 PM

2025年在杠杆交易、安全性和用户体验方面表现突出的平台有：1. OKX，适合高频交易者，提供最高100倍杠杆；2. Binance，适用于全球多币种交易者，提供125倍高杠杆；3. Gate.io，适合衍生品专业玩家，提供100倍杠杆；4. Bitget，适用于新手及社交化交易者，提供最高100倍杠杆；5. Kraken，适合稳健型投资者，提供5倍杠杆；6. Bybit，适用于山寨币探索者，提供20倍杠杆；7. KuCoin，适合低成本交易者，提供10倍杠杆；8. Bitfinex，适合资深玩

See all articles

哄一哄可以让GPT-3准确率提高61%！谷歌和东京大学的研究令人震惊

语言大模型是零样本推理者

加点“魔法”已经成为AI圈新潮了

热AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

热门文章

热工具

记事本++7.3.1

SublimeText3汉化版

禅工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

热门话题