超越因果语言建模
> Neurips 2024聚光灯:使用选择性语言建模(SLM)
进行优化语言模型>最近,我提出了一份来自2024年Neurips的引人入胜的论文,“并非所有的标记都是您在当地阅读组中所需的。” 本文解决了一个令人惊讶的简单但有影响力的问题:在训练语言模型期间,每个令牌是否需要下一步的预测? >标准方法涉及大量的网络绑带数据集和普遍应用因果语言建模(CLM)。 本文提出了假设的挑战,提出某些令牌阻碍了学习过程而不是帮助。 作者表明,将培训集中在“有用”代币上可以显着提高数据效率和下游任务绩效。 这篇文章总结了他们的核心思想和关键的实验发现。
>
问题:噪声和效率低下的学习> >大型网络中心不可避免地包含噪音。虽然文档级过滤有所帮助,但噪声通常位于各个文档中。 这些嘈杂的令牌浪费了计算资源,并可能使模型混淆。 作者分析了令牌级学习动力学,基于其跨渗透损失轨迹对令牌进行分类:
l→l(低至低):
迅速学习,提供最小的进一步好处。- h→l(高到低):最初很困难,但最终学会了;代表宝贵的学习机会。
- h→h(高到高):始终困难,通常是由于固有的不可预测性(良好的不确定性)。>
- l→H(低至高):最初学会,但后来成为问题,可能是由于上下文变化或噪声。 他们的分析表明,只有一小部分代币提供有意义的学习信号。 >
- 解决方案:选择性语言建模(SLM)> 建议的解决方案,选择性语言建模(SLM),提供了一种更具针对性的方法:
参考模型(RM)训练:
多余的损失计算:
-
> 选择性反向传播:
进行反向传播。这动态地将培训集中在最有价值的代币上。在所有令牌上都执行完整的正向通行证,但是仅对多余损失最高的代币的顶部 k% >
实验结果:显着增长
SLM在各种实验中都具有显着优势:
在
自我引用:
即使是来自RAW语料库的快速训练的RM也提供了2-3%的准确性提升,而使用的代币降低了30-40%。>结论和未来工作
>以上是超越因果语言建模的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

Meta的Llama 3.2:多模式和移动AI的飞跃 Meta最近公布了Llama 3.2,这是AI的重大进步,具有强大的视觉功能和针对移动设备优化的轻量级文本模型。 以成功为基础

嘿,编码忍者!您当天计划哪些与编码有关的任务?在您进一步研究此博客之前,我希望您考虑所有与编码相关的困境,这是将其列出的。 完毕? - 让&#8217

本周的AI景观:进步,道德考虑和监管辩论的旋风。 OpenAI,Google,Meta和Microsoft等主要参与者已经释放了一系列更新,从开创性的新车型到LE的关键转变

Shopify首席执行官TobiLütke最近的备忘录大胆地宣布AI对每位员工的基本期望是公司内部的重大文化转变。 这不是短暂的趋势。这是整合到P中的新操作范式

介绍 想象一下,穿过美术馆,周围是生动的绘画和雕塑。现在,如果您可以向每一部分提出一个问题并获得有意义的答案,该怎么办?您可能会问:“您在讲什么故事?

介绍 Openai已根据备受期待的“草莓”建筑发布了其新模型。这种称为O1的创新模型增强了推理能力,使其可以通过问题进行思考

SQL的Alter表语句:动态地将列添加到数据库 在数据管理中,SQL的适应性至关重要。 需要即时调整数据库结构吗? Alter表语句是您的解决方案。本指南的详细信息添加了Colu

对于那些可能是我专栏新手的人,我广泛探讨了AI的最新进展,包括体现AI,AI推理,AI中的高科技突破,及时的工程,AI培训,AI,AI RE RE等主题
