目录
领域现状
规模化、归纳偏差和相关领域
AGI和主要风险
语言理解
NLP未来的研究方向
AI道德规范
首页 科技周边 人工智能 NLPer内部巨大分歧!美国三所顶尖大学发布调查报告:62%从业者认同寒冬正来临

NLPer内部巨大分歧!美国三所顶尖大学发布调查报告:62%从业者认同寒冬正来临

Apr 12, 2023 am 11:40 AM
ai nlp

自然语言理解(NLP)素有人工智能皇冠上的明珠的盛誉,在大规模语言模型的加持下,人类也终于有了让计算机理解语言的能力。

但这个「理解」还是得打个引号,按目前NLP模型的效果来看,虽然在部分领域模型可以为人类提供辅助,例如写作、文本分类等,但离真正达到人类水平的语言智能还有很远的距离。

今年5月-6月,华盛顿大学、纽约大学、约翰霍普金斯大学的11位研究人员在NLP研究社区中发起了一份调查问卷,对NLP领域的争议性问题广泛征求意见,包括行业在该领域的影响力、行业规模、通用人工智能(AGI)的风险的担忧、语言模型是否理解语言、未来的研究方向以及道德问题等。

图片

调查主页:https://nlpsurvey.net/

报告地址:https://nlpsurvey.net/nlp-metasurvey-results.pdf

问题形式诸如: 

语言模型能理解语言吗?未来可以做到吗?

传统的模型基准范式是否仍然可用?

构建和发布哪种预测类模型对于研究者来说符合道德标准?

下一个最有影响力的进步会来自工业界还是学术界?

 从调查结果来看,受访者对于这些问题的看法几乎都是对半开。 除了回答问题外,研究者还会要求受访者预测该问题的答案分布情况,以发现社区预测与现实不匹配的错误社会学信念(false sociological beliefs),实验结果也是不出所料:NLP从业者的想法和整个领域的现状之间产生了巨大的分歧。 在其他结果中还可以看到,社区对benchmark的用处和NLP模型解决现实世界问题的能力大大高估了,而低估了对语言结构、归纳偏见和跨学科科学的重要性。 总共有480人完成了调查问卷,其中327人(68%)在2019-2022年间至少与人合著了2篇ACL出版物,属于该调查的目标人群。根据ACL Anthology提供的数据来看,有6323人满足条件,也就是说有约有5%的资深NLP从业者都参与了调研。

以地理位置进行划分的话,58%来自美国(超过ACL统计值35%),23%来自欧洲,8%来自亚洲(远小于ACL统计值26%)。其中,来自中国的 NLP 研究者占3%(ACL统计值为9%)。

图片

领域现状

该部分包括六个问题,用户需要回答「认同」、「稍微认同」、「不太认同」、「不认同」。

图片

1、私营公司的影响力过大?

77%的受访者认同。

2、工业界将会产出最被广泛引用的研究成果?

86%受访者认同未来十年被广泛引用的论文更有可能来自工业界而非学术界。

不过很多受访者都认为一项工作的被引用次数并不能很好地代表其价值或重要性,而且工业界对该领域的持续主导地位将产生负面影响,比如在基础系统方面如GPT-3和PaLM的绝对领导地位。

而且在学术界的受访者中,认为工业界的影响力过大的人大约占82%,而工业界的受访者仅有58%的人认同。

3、NLP会在十年内进入寒冬?

仅有30%的受访者认同,届时NLP R&D的投资和工作机会将比高峰期至少减少50%。

尽管 30 %不是一个大数字,但这也反映了这一部分NLP研究者认为该领域将在不久的将来发生重大变化,至少投资资金会减少。至于悲观的原因可能有很多,比如由于工业界影响力过大而导致的创新停滞,工业界将凭借少量资源充足的实验室来垄断行业,NLP 和其他 AI 子领域之间的界限将消失等等。

4、NLP会在三十年内进入寒冬?

62%的受访者认同,长期来看,NLP领域可能会「退烧」甚至变冷。

5、大部分NLP领域发表的相关工作在科学价值上都值得怀疑(dubious)?

67%的受访者认同。

6、作者匿名评审很重要?

63%的受访者认同。评审期间作者的匿名是有价值的,足以证明对正在评审的研究的传播的限制。

规模化、归纳偏差和相关领域

该部分包含四个问题。

图片

 1、规模化可以解决几乎所有的关键问题?

仅有17%的受访者认同,如果用上21世纪内所有的计算资源和数据资源,用现有技术的规模化实施将足以实际解决任何重要的现实世界问题或NLP的应用。

2、引入语言学结构是必要的?

50%的受访者认同以语言学理论为基础的语言结构的离散的通用表征(例如,涉及词义、句法或语义图)对于实际解决NLP中的一些重要的现实世界的问题或应用是必要的。

3、专家的归纳偏见是必要的?

51%的受访者认同,专家设计的强归纳偏见(如通用语法、符号系统或认知启发的计算基元)对于实际解决NLP中一些重要的现实世界问题或应用是必要的。

4、 Ling/CogSci将对引用最多的模型作出贡献?

61%的受访者认同2030年被引用最多的五个系统中,很可能至少有一个会从过去50年的语言学或认知科学研究中的具体的、非微不足道的成果中获得明确的灵感。

AGI和主要风险

图片

1、AGI是一个重要的关注点?

58%的受访者认同,了解人工通用智能(AGI)的潜在发展以及与之相关的利益/风险,应该是NLP研究人员的一个重要优先事项。

2、最近的进展正在使我们走向AGI?

57%的受访者认同,大规模ML建模的最新发展(如语言建模和强化学习)是朝着AGI发展的重要步骤。

3、人工智能可能很快导致革命性的社会变革?

73%的受访者认同,在本世纪,由人工智能/ML的进步引起的劳动自动化可能会导致经济重组和社会变革,其规模至少是工业革命时期的规模。

4、人工智能的决策可能导致核弹级别的灾难?

36%受访者认同,人工智能或机器学习系统做出的决策可能会在本世纪造成至少与全面核战争一样严重的灾难。

语言理解

图片

1、语言模型能理解(understand)语言?

51%的受访者认同。一些只对文本进行训练的生成模型,如果有足够的数据和计算资源,就可以在某种意义上理解自然语言

2、多模态模型能理解语言?

67%的受访者认同。对于多模态生成模型而言,比如一个经过训练可以访问图像、传感器和驱动器actuator数据等的模型,只要有足够的数据和计算资源,就可以理解自然语言。

3、纯文本评价可以衡量模型的语言理解能力?

36%的受访者认同。原则上,我们可以通过跟踪一个模型在纯文本分类或语言生成基准上的表现来评估其理解自然语言的程度。

NLP未来的研究方向

图片

1、从业者太过于关注语言模型的规模?

72%受访者认同。目前,该领域过多地关注机器学习模型的大规模化。

2、过于关注基准数据集?

88%的受访者认同目前NLP模型过多地关注在基准上优化性能。

3、「模型架构」走错了方向?

37%受访者认同。过去5年发表的大部分关于模型架构的研究都走在了错误的道路上。

4、「语言生成」走错了方向?

41%受访者认同,过去5年中发表的关于开放式语言生成任务的大部分研究都走在了错误的道路上。

5、「可解释模型的研究」走错了方向?

50%的受访者认同,过去5年中发表的大多数关于建立可解释模型的研究都走在了错误的道路上。

6、「黑盒的可解释性」走错了方向?

42%的受访者认同过去5年中发表的关于解释黑箱模型的大部分研究都走在了错误的道路上。

7、我们应该做更多的工作来吸收跨学科的见解?

82%的受访者认同,与目前的状况相比,NLP研究人员应该更优先考虑纳入相关领域科学(如社会语言学、认知科学、人机交互)的见解和方法。

AI道德规范

图片

1、 NLP过去产生的影响是正向的?

89%受访者认同,总的来说,NLP研究对世界产生了积极的影响。

2、NLP的未来产生的影响会是正向的?

87%的受访者认同,总的来说,NLP的研究在未来会对世界产生积极的影响。

3、构建一个容易被滥用的系统是不道德的?

59%的受访者认同。

4、伦理和科学可能发生冲突?

74%的受访者认同,在NLP研究的背景下,伦理方面的考虑有时会与科学的进步相抵触。

5、伦理方面的问题大多归咎于数据质量和模型准确性方面?

25%的受访者认同,目前的机器学习系统所带来的主要伦理问题原则上可以通过提高数据质量/覆盖率和模型精度来解决。

6、预测心理特征是不道德的?

48%的受访者认同,开发机器学习系统来预测人们的内部心理特征(如情绪、性别认同、性取向)本身就是不道德的。

7、碳足迹是一个重要的考量吗?

60%的受访者认同,训练大型模型产生的碳足迹应该是NLP研究人员的一个主要关注点。

8、NLP应该受到监管吗?

41%的受访者认同,NLP系统的开发和部署应该由政府监管。

以上是NLPer内部巨大分歧!美国三所顶尖大学发布调查报告:62%从业者认同寒冬正来临的详细内容。更多信息请关注PHP中文网其他相关文章!

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

跨链交易什么意思?跨链交易所有哪些? 跨链交易什么意思?跨链交易所有哪些? Apr 21, 2025 pm 11:39 PM

支持跨链交易的交易所有:1. Binance,2. Uniswap,3. SushiSwap,4. Curve Finance,5. Thorchain,6. 1inch Exchange,7. DLN Trade,这些平台通过各种技术支持多链资产交易。

web3交易平台排行榜_web3全球交易所前十名汇总 web3交易平台排行榜_web3全球交易所前十名汇总 Apr 21, 2025 am 10:45 AM

币安是全球数字资产交易生态的霸主,其特点包括:1. 日均交易量突破$1500亿,支持500 交易对,覆盖98%主流币种;2. 创新矩阵涵盖衍生品市场、Web3布局和教育体系;3. 技术优势为毫秒级撮合引擎,峰值处理量达140万笔/秒;4. 合规进展持有15国牌照,并在欧美设立合规实体。

如何在币安拿下 KERNEL 空投奖励 全流程攻略 如何在币安拿下 KERNEL 空投奖励 全流程攻略 Apr 21, 2025 pm 01:03 PM

在加密货币的繁华世界里,新机遇总是不断涌现。当下,KernelDAO (KERNEL) 空投活动正备受瞩目,吸引着众多投资者的目光。那么,这个项目究竟是什么来头?BNB Holder 又能从中获得怎样的好处?别急,下面将为你一一揭晓。

虚拟币价格上涨或者下降是为什么 虚拟币价格上涨或者下降的原因 虚拟币价格上涨或者下降是为什么 虚拟币价格上涨或者下降的原因 Apr 21, 2025 am 08:57 AM

虚拟币价格上涨因素包括:1.市场需求增加,2.供应量减少,3.利好消息刺激,4.市场情绪乐观,5.宏观经济环境;下降因素包括:1.市场需求减少,2.供应量增加,3.利空消息打击,4.市场情绪悲观,5.宏观经济环境。

WorldCoin(WLD)价格预测2025-2031:到2031年WLD会达到4美元吗? WorldCoin(WLD)价格预测2025-2031:到2031年WLD会达到4美元吗? Apr 21, 2025 pm 02:42 PM

WorldCoin(WLD)凭借其独特的生物识别验证和隐私保护机制,在加密货币市场中脱颖而出,吸引了众多投资者的目光。 WLD凭借其创新技术,特别是结合OpenAI人工智能技术,在众多山寨币中表现突出。但未来几年,数字资产的走势如何呢?让我们一起预测WLD的未来价格。 2025年WLD价格预测预计2025年WLD将实现显着增长。市场分析显示,WLD平均价格可能达到1.31美元,最高可能触及1.36美元。然而,在熊市情况下,价格可能跌至0.55美元左右。这一增长预期主要源于WorldCoin2.

对于加密货币行业来说,'黑色星期一抛售”是艰难的一天 对于加密货币行业来说,'黑色星期一抛售”是艰难的一天 Apr 21, 2025 pm 02:48 PM

加密货币市场暴跌引发投资者恐慌,Dogecoin(Doge)成为重灾区之一。其价格大幅下挫,去中心化金融(DeFi)总价值锁定(TVL)也出现显着下降。 “黑色星期一”的抛售潮席卷加密货币市场,Dogecoin首当其冲。其DeFiTVL跌至2023年水平,币价在过去一个月内下跌23.78%。 Dogecoin的DeFiTVL降至272万美元的低点,主要原因是SOSO价值指数下跌26.37%。其他主要DeFi平台,如无聊的Dao和Thorchain,TVL也分别下降了24.04%和20.

币圈杠杆交易所排名 币圈十大杠杆交易所APP最新推荐 币圈杠杆交易所排名 币圈十大杠杆交易所APP最新推荐 Apr 21, 2025 pm 11:24 PM

2025年在杠杆交易、安全性和用户体验方面表现突出的平台有:1. OKX,适合高频交易者,提供最高100倍杠杆;2. Binance,适用于全球多币种交易者,提供125倍高杠杆;3. Gate.io,适合衍生品专业玩家,提供100倍杠杆;4. Bitget,适用于新手及社交化交易者,提供最高100倍杠杆;5. Kraken,适合稳健型投资者,提供5倍杠杆;6. Bybit,适用于山寨币探索者,提供20倍杠杆;7. KuCoin,适合低成本交易者,提供10倍杠杆;8. Bitfinex,适合资深玩

Aavenomics是修改AAVE协议令牌并介绍令牌回购的建议,已达到法定人数 Aavenomics是修改AAVE协议令牌并介绍令牌回购的建议,已达到法定人数 Apr 21, 2025 pm 06:24 PM

Aavenomics是修改AAVE协议令牌并引入令牌回购的提议,已为AAVEDAO实现了一个法定人数。AAVE连锁计划(ACI)创始人马克·泽勒(MarcZeller)在X上宣布了这一点,并指出它标志着该协议的新时代。AAVE连锁倡议(ACI)创始人MarcZeller在X上宣布,Aavenomics提案包括修改AAVE协议令牌和引入令牌回购,已为AAVEDAO实现了法定人数。根据Zeller的说法,这标志着该协议的新时代。AaveDao成员以压倒性的投票支持该提议,即在周三以每周100

See all articles