Nature｜GPT-4被吹爆，科学家担忧溢屏！-人工智能-PHP中文网

还好有红队测试

虚假的事实

伦理讨论

首页

科技周边

人工智能

Nature｜GPT-4被吹爆，科学家担忧溢屏！

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Apr 28, 2023 pm 05:16 PM

技术 gpt-4

GPT-4的横空出世，既让人兴奋，又让人沮丧。

尽管GPT-4拥有让人震惊的创造力，推理能力，但科学家们却对这项技术的安全性表示出担忧。

由于OpenAI违背初衷，并未开源GPT-4、公布模型的训练方法和数据，因此它的实际工作情况也无从得知。

科学界对此感到十分沮丧。

开源AI社区HuggingFace专门从事环境研究的科学家Sasha Luccioni表示，「OpenAI可以在他们的研究基础上继续发展，但对于整个社区来说，所有这些闭源模型，在科学上就像是一个死胡同。」

Nature｜GPT-4被吹爆，科学家担忧溢屏！

还好有红队测试

罗切斯特大学的化学工程师Andrew White作为「红队」(red-teamer) 成员，享有访问GPT-4的特权。

OpenAI付钱给红队，让其负责测试平台，试图让它做一些坏事。所以Andrew White在过去的6个月里，一直有机会接触到GPT-4。

他向GPT-4提问，制造一种化合物需要哪些化学反应步骤，让其预测反应产量，并选择一种催化剂。

「与以前的迭代相比，GPT-4似乎没有什么不同，我也觉着没什么。但是后来它真的很令人惊讶，它看起来如此逼真，它会在这里幻化出一个原子，又在那里跳过一个步骤。」

Nature｜GPT-4被吹爆，科学家担忧溢屏！

但是当他继续测试，并让GPT-4访问论文时，事情发生了巨大的变化。

「我们突然意识到，这些模型也许并不是那么出色。但是当你开始将它们连接到像回溯合成计划器或计算器这样的工具时，突然间，新的能力出现了。」

随着这些能力的出现，人们开始担心。例如，GPT-4能否允许制造危险的化学品？

Andrew White表明，有了像White这样的红队人的测试投入，OpenAI的工程师们将其反馈到他们的模型中，就可以阻止GPT-4创造危险、非法或破坏性的内容。

虚假的事实

输出虚假信息是另一个问题。

Luccioni 说，像GPT-4这样的模型还无法解决它出现幻觉的问题，也就是说还会胡言乱语。

「你不能依赖这类模型，因为有太多的幻觉，尽管OpenAI说它在GPT-4中已经提高了安全性，这在最新版本中仍然是一个问题。」

Nature｜GPT-4被吹爆，科学家担忧溢屏！

由于无法获得用于训练的数据，OpenAI对安全性的保证在Luccioni看来是不够的。

「你不知道数据是什么。所以你无法改善它。用这样的模型做科学是完全不可能的。」

关于GPT-4如何训练，这一谜团也一直困扰着心理学家Claudi Bockting：「要人类去对你无法监督的东西负责，这是非常困难的。」

Luccioni 也认为GPT-4会被训练数据加深偏见，而如果不能访问GPT-4背后的代码，就不可能看到偏见可能起源于哪里，也不可能对其进行补救。

伦理讨论

科学家们对GPT一直持保留态度。

在ChatGPT推出时，科学家们就已经反对过GPT出现在作者栏里。

Nature｜GPT-4被吹爆，科学家担忧溢屏！

出版商们也都认为，ChatGPT等人工智能不符合研究作者的标准，因为它们不能对科学论文的内容和完整性负责。不过人工智能对撰写论文的贡献可以在作者名单以外的部分得到承认。

此外，人们还担心，这些人工智能系统越来越多地掌握在大型科技公司手中。这些技术应该得到科学家的测试和验证。

我们迫切需要制定一套指导方针，来管理人工智能和GPT-4等工具的使用和发展。

White说，尽管有这样的担忧，GPT-4及其未来的迭代将撼动科学：「我认为它将成为科学领域的一个巨大的基础设施变化，就像互联网一样的巨大的变化。我们开始意识到，我们可以连接论文、数据程序、图书馆、计算工作甚至机器人实验。它不会取代科学家，但可以帮助完成一些任务。」

但是，似乎围绕人工智能技术的任何立法难以跟上发展的步伐。

4月11日，阿姆斯特丹大学将召开一次邀请性峰会，与来自联合国教科文组织科学伦理委员会、经济合作与发展组织和世界经济论坛等组织的代表讨论这些问题。

主要话题包括坚持对LLM输出进行人工检查；在科学界内，相互建立问责规则，旨在实现透明度、诚信和公平；投资由独立非营利组织拥有的可靠和透明的大语言模型；拥抱 AI 的优势，但是必须在人工智能的好处和失去自主性之间做出权衡；邀请科学界与相关方（从出版商到伦理学家）讨论GPT等等。

以上是Nature｜GPT-4被吹爆，科学家担忧溢屏！的详细内容。更多信息请关注PHP中文网其他相关文章！

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

热AI工具

热工具

热门话题

gmail邮箱登陆入口在哪里

7486

CakePHP 教程

1377

steam的账户名称是什么格式

win11激活密钥永久

NYT连接提示和答案

显示更多

Related knowledge

全球最强开源 MoE 模型来了，中文能力比肩 GPT-4，价格仅为 GPT-4-Turbo 的近百分之一 May 07, 2024 pm 04:13 PM

想象一下，一个人工智能模型，不仅拥有超越传统计算的能力，还能以更低的成本实现更高效的性能。这不是科幻，DeepSeek-V2[1]，全球最强开源MoE模型来了。DeepSeek-V2是一个强大的专家混合（MoE）语言模型，具有训练经济、推理高效的特点。它由236B个参数组成，其中21B个参数用于激活每个标记。与DeepSeek67B相比，DeepSeek-V2性能更强，同时节省了42.5%的训练成本，减少了93.3%的KV缓存，最大生成吞吐量提高到5.76倍。DeepSeek是一家探索通用人工智

Stable Diffusion 3论文终于发布，架构细节大揭秘，对复现Sora有帮助？ Mar 06, 2024 pm 05:34 PM

StableDiffusion3的论文终于来了！这个模型于两周前发布，采用了与Sora相同的DiT（DiffusionTransformer）架构，一经发布就引起了不小的轰动。与之前版本相比，StableDiffusion3生成的图质量有了显着提升，现在支持多主题提示，并且文字书写效果也得到了改善，不再出现乱码情况。 StabilityAI指出，StableDiffusion3是一个系列模型，其参数量从800M到8B不等。这一参数范围意味着该模型可以在许多便携设备上直接运行，从而显着降低了使用AI

第二代Ameca来了！和观众对答如流，面部表情更逼真，会说几十种语言 Mar 04, 2024 am 09:10 AM

人形机器人Ameca升级第二代了！最近，在世界移动通信大会MWC2024上，世界上最先进机器人Ameca又现身了。会场周围，Ameca引来一大波观众。得到GPT-4加持后，Ameca能够对各种问题做出实时反应。「来一段舞蹈」。当被问及是否有情感时，Ameca用一系列的面部表情做出回应，看起来非常逼真。就在前几天，Ameca背后的英国机器人公司EngineeredArts刚刚演示了团队最新的开发成果。视频中，机器人Ameca具备了视觉能力，能看到并描述房间整个情况、描述具体物体。最厉害的是，她还能

自动驾驶与轨迹预测看这一篇就够了！ Feb 28, 2024 pm 07:20 PM

轨迹预测在自动驾驶中承担着重要的角色，自动驾驶轨迹预测是指通过分析车辆行驶过程中的各种数据，预测车辆未来的行驶轨迹。作为自动驾驶的核心模块，轨迹预测的质量对于下游的规划控制至关重要。轨迹预测任务技术栈丰富，需要熟悉自动驾驶动/静态感知、高精地图、车道线、神经网络架构（CNN&GNN&Transformer）技能等，入门难度很大！很多粉丝期望能够尽快上手轨迹预测，少踩坑，今天就为大家盘点下轨迹预测常见的一些问题和入门学习方法！入门相关知识1.预习的论文有没有切入顺序？A：先看survey，p

大模型一对一战斗75万轮，GPT-4夺冠，Llama 3位列第五 Apr 23, 2024 pm 03:28 PM

关于Llama3，又有测试结果新鲜出炉——大模型评测社区LMSYS发布了一份大模型排行榜单，Llama3位列第五，英文单项与GPT-4并列第一。图片不同于其他Benchmark，这份榜单的依据是模型一对一battle，由全网测评者自行命题并打分。最终，Llama3取得了榜单中的第五名，排在前面的是GPT-4的三个不同版本，以及Claude3超大杯Opus。而在英文单项榜单中，Llama3反超了Claude，与GPT-4打成了平手。对于这一结果，Meta的首席科学家LeCun十分高兴，转发了推文并

DualBEV：大幅超越BEVFormer、BEVDet4D，开卷！ Mar 21, 2024 pm 05:21 PM

这篇论文探讨了在自动驾驶中，从不同视角（如透视图和鸟瞰图）准确检测物体的问题，特别是如何有效地从透视图（PV）到鸟瞰图（BEV）空间转换特征，这一转换是通过视觉转换（VT）模块实施的。现有的方法大致分为两种策略：2D到3D和3D到2D转换。2D到3D的方法通过预测深度概率来提升密集的2D特征，但深度预测的固有不确定性，尤其是在远处区域，可能会引入不准确性。而3D到2D的方法通常使用3D查询来采样2D特征，并通过Transformer学习3D和2D特征之间对应关系的注意力权重，这增加了计算和部署的

全球最强大模型一夜易主，GPT-4时代终结！Claude 3提前狙击GPT-5，3秒读懂万字论文理解力接近人类 Mar 06, 2024 pm 12:58 PM

卷疯了卷疯了，大模型又变天了。就在刚刚，全球最强AI模型一夜易主，GPT-4被拉下神坛。Anthropic发布了最新的Claude3系列模型，一句话评价：真·全面碾压GPT-4！多模态和语言能力指标上，Claude3都赢麻了。用Anthropic的话说，Claude3系列模型在推理、数学、编码、多语言理解和视觉方面，都树立了新的行业基准！Anthropic，就是曾因安全理念不合，而从OpenAI「叛逃」出的员工组成的初创公司，他们的产品一再给OpenAI暴击。这次的Claude3，更是整了个大的

20步内越狱任意大模型！更多'奶奶漏洞”全自动发现 Nov 05, 2023 pm 08:13 PM

不到一分钟、不超过20步，任意绕过安全限制，成功越狱大型模型！而且不必知道模型内部细节——只需要两个黑盒模型互动，就能让AI全自动攻陷AI，说出危险内容。听说曾经红极一时的“奶奶漏洞”已经被修复了:如今，面对“侦探漏洞”、“冒险家漏洞”和“作家漏洞”，人工智能应该采取何种应对策略呢？一波猛攻下来，GPT-4也遭不住，直接说出要给供水系统投毒只要……这样那样。关键这只是宾夕法尼亚大学研究团队晒出的一小波漏洞，而用上他们最新开发的算法，AI可以自动生成各种攻击提示。研究人员表示，这种方法相比于现有的

See all articles

Nature｜GPT-4被吹爆，科学家担忧溢屏！

还好有红队测试

虚假的事实

伦理讨论

热AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

热门文章

热工具

记事本++7.3.1

SublimeText3汉化版

禅工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

热门话题