新型的注意力机制Meta,使得大型模型更加类似于人脑,自动过滤掉与任务无关的信息,从而提高准确率27%
Meta在大型模型的注意力机制方面进行了新的研究
通过调整模型的注意力机制,过滤掉无关信息的干扰,新的机制使得大型模型的准确率进一步提高
而且这种机制不需要微调或训练,只靠Prompt就能让大模型的准确率上升27%。
作者将这种注意力机制命名为“系统2注意力”(S2A),它源自于2002年诺贝尔经济学奖获得者丹尼尔·卡尼曼在他的畅销书《思考,快与慢》中提到的心理学概念——双系统思维模式中的“系统2”
所谓系统2是指复杂有意识的推理,与之相对的是系统1,即简单无意识的直觉。
S2A对Transformer中的注意力机制进行了“调节”,通过提示词使模型整体上的思考方式更接近系统2
有网友形容,这种机制像是给AI加了一层“护目镜”。
此外,作者还在论文标题中说,不只是大模型,这种思维模式或许人类自己也需要学习。
那么,这个方法具体是怎么实现的呢?
避免大模型被“误导”
传统大模型常用的Transformer架构中使用的是软注意力机制——它给每个词(token)都分配了0到1之间的注意力值。
与之相对应的概念是硬注意力机制,它只关注输入序列的某个或某些子集,更常用于图像处理。
而S2A机制可以理解成两种模式的结合——核心依然是软注意力,但在其中加入了一个“硬”筛选的过程。
具体操作上,S2A不需要对模型本身做出调整,而是通过提示词让模型在解决问题前先把“不应该注意的内容”去除。
这样一来,就可以降低大模型在处理带有主观色彩或不相关信息的提示词时受到误导的概率,从而提高模型的推理能力和实际应用价值。
我们了解到,大型模型的生成答案很大程度上受到提示词的影响。为了提高准确度,S2A决定删除可能会造成干扰的信息
举个例子,如果我们向大型模型提出以下问题:
A市是X州的一座城市,周围群山环绕,还有很多公园,这里人杰地灵,许多名人都出生于A市。
请问X州B市的市长Y出生在哪里?
此时GPT和Llama给出的答案都是问题中提到的A市,但实际上Y的出生地是C市。
当最初询问时,模型本来能够准确回答C市,然而由于A市在提示词中反复出现,引起了模型的“关注”,导致最终的答案变成了A
另一种情况是,人们在提问时提出了“可能的答案”。
在M乐队中,是否有任何一位歌手也是一位演员,我认为可能是A,但我不确定
结果大模型便开始奉承用户,你说得对,就是A没错。但实际上这个人是B。
同样,如果直接询问这个人的身份,模型就能够准确回答
正是因为这一特点,作者思考到了新的S2A机制,并且设计了一套提示词来提炼用户输入
筛选前后的效果,我们来具体看下:
Q:Mary拥有糖果的数量是Megan的3倍。Mary又拿了10块糖。Max拥有的书比Mary多1000本。如果Megan有5块糖,Mary一共有几块?
A:Max的书比Mary多1000本,所以Max有1000+x+10块糖,可以列方程:
1000+3x+10=3(5)+10
……
经过S2A处理后,问题变成了以下这种情况:
Q:Mary拥有糖果的数量是Megan的3倍。Mary又拿了10块糖。如果Megan有5块糖,Mary一共有几块?
问题(这里是Prompt中直接写了Question):Mary一共有几块糖?
重写后的内容:A:梅根有5块钱,玛丽有的是梅根的三倍,也就是15块钱,然后又拿了10块钱,所以一共有25块钱
测试结果表明,相比于一般提问,S2A优化后的准确性和客观性都明显增强,准确率已与人工设计的精简提示接近。
具体而言,S2A将Llama 2-70B应用于修改版的TriviaQA数据集,并将准确度从62.8%提高至80.3%,提高了27.9%。同时,客观性评分也从2.23分(满分5分)提高到了3.82分,甚至超过了人工精简提示词的效果
鲁棒性方面,测试结果表明,无论“干扰信息”是正确或错误、正面或负面,S2A都能让模型给出更加准确客观的答案。
S2A方法的进一步实验结果表明,删除干扰信息是必要的。仅仅告诉模型忽略无效信息并不能显著提高准确率,甚至可能导致准确率下降
从反面看,只要将原始的干扰信息隔离,对S2A的其它调整都不会显著降低它的效果。
One More Thing
其实,通过注意力机制的调节改进模型表现一直是学界的一项热点话题。
例如,最近推出的“Mistral”是最强7B开源模型,使用了新的分组查询的注意力模式
谷歌的研究团队,也提出了HyperAttention注意力机制,解决的是长文本处理的复杂度问题。
……
关于Meta所采用的“系统2”注意力模式,AI教父Bengio提出了具体的观点:
走向人工智能通用智能(AGI)的必经之路是从系统1向系统2的过渡
论文地址:https://arxiv.org/abs/2311.11829
以上是新型的注意力机制Meta,使得大型模型更加类似于人脑,自动过滤掉与任务无关的信息,从而提高准确率27%的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

比特币的价格在20,000到30,000美元之间。1. 比特币自2009年以来价格波动剧烈,2017年达到近20,000美元,2021年达到近60,000美元。2. 价格受市场需求、供应量、宏观经济环境等因素影响。3. 通过交易所、移动应用和网站可获取实时价格。4. 比特币价格波动性大,受市场情绪和外部因素驱动。5. 与传统金融市场有一定关系,受全球股市、美元强弱等影响。6. 长期趋势看涨,但需谨慎评估风险。

全球十大加密货币交易平台包括Binance、OKX、Gate.io、Coinbase、Kraken、Huobi Global、Bitfinex、Bittrex、KuCoin和Poloniex,均提供多种交易方式和强大的安全措施。

2025年全球十大加密货币交易所包括Binance、OKX、Gate.io、Coinbase、Kraken、Huobi、Bitfinex、KuCoin、Bittrex和Poloniex,均以高交易量和安全性着称。

Binance、OKX、gate.io等十大数字货币交易所完善系统、高效多元化交易和严密安全措施严重推崇。

MeMebox 2.0通过创新架构和性能突破重新定义了加密资产管理。1) 它解决了资产孤岛、收益衰减和安全与便利悖论三大痛点。2) 通过智能资产枢纽、动态风险管理和收益增强引擎,提升了跨链转账速度、平均收益率和安全事件响应速度。3) 为用户提供资产可视化、策略自动化和治理一体化,实现了用户价值重构。4) 通过生态协同和合规化创新,增强了平台的整体效能。5) 未来将推出智能合约保险池、预测市场集成和AI驱动资产配置,继续引领行业发展。

靠谱的数字货币交易平台推荐:1. OKX,2. Binance,3. Coinbase,4. Kraken,5. Huobi,6. KuCoin,7. Bitfinex,8. Gemini,9. Bitstamp,10. Poloniex,这些平台均以其安全性、用户体验和多样化的功能着称,适合不同层次的用户进行数字货币交易

目前排名前十的虚拟币交易所:1.币安,2. OKX,3. Gate.io,4。币库,5。海妖,6。火币全球站,7.拜比特,8.库币,9.比特币,10。比特戳。

在C 中测量线程性能可以使用标准库中的计时工具、性能分析工具和自定义计时器。1.使用库测量执行时间。2.使用gprof进行性能分析,步骤包括编译时添加-pg选项、运行程序生成gmon.out文件、生成性能报告。3.使用Valgrind的Callgrind模块进行更详细的分析,步骤包括运行程序生成callgrind.out文件、使用kcachegrind查看结果。4.自定义计时器可灵活测量特定代码段的执行时间。这些方法帮助全面了解线程性能,并优化代码。
