Nature|GPT-4被吹爆,科学家担忧溢屏!
GPT-4的横空出世,既让人兴奋,又让人沮丧。
尽管GPT-4拥有让人震惊的创造力,推理能力,但科学家们却对这项技术的安全性表示出担忧。
由于OpenAI违背初衷,并未开源GPT-4、公布模型的训练方法和数据,因此它的实际工作情况也无从得知。
科学界对此感到十分沮丧。
开源AI社区HuggingFace专门从事环境研究的科学家Sasha Luccioni表示,「OpenAI可以在他们的研究基础上继续发展,但对于整个社区来说,所有这些闭源模型,在科学上就像是一个死胡同。」
还好有红队测试
罗切斯特大学的化学工程师Andrew White作为 「红队」(red-teamer) 成员,享有访问GPT-4的特权。
OpenAI付钱给红队,让其负责测试平台,试图让它做一些坏事。所以Andrew White在过去的6个月里,一直有机会接触到GPT-4。
他向GPT-4提问,制造一种化合物需要哪些化学反应步骤,让其预测反应产量,并选择一种催化剂。
「与以前的迭代相比,GPT-4似乎没有什么不同,我也觉着没什么。但是后来它真的很令人惊讶,它看起来如此逼真,它会在这里幻化出一个原子,又在那里跳过一个步骤。」
但是当他继续测试,并让GPT-4访问论文时,事情发生了巨大的变化。
「我们突然意识到,这些模型也许并不是那么出色。但是当你开始将它们连接到像回溯合成计划器或计算器这样的工具时,突然间,新的能力出现了。」
随着这些能力的出现,人们开始担心。例如,GPT-4能否允许制造危险的化学品?
Andrew White表明,有了像White这样的红队人的测试投入,OpenAI的工程师们将其反馈到他们的模型中,就可以阻止GPT-4创造危险、非法或破坏性的内容。
虚假的事实
输出虚假信息是另一个问题。
Luccioni 说,像GPT-4这样的模型还无法解决它出现幻觉的问题,也就是说还会胡言乱语。
「你不能依赖这类模型,因为有太多的幻觉,尽管OpenAI说它在GPT-4中已经提高了安全性,这在最新版本中仍然是一个问题。」
由于无法获得用于训练的数据,OpenAI对安全性的保证在Luccioni看来是不够的。
「你不知道数据是什么。所以你无法改善它。用这样的模型做科学是完全不可能的。」
关于GPT-4如何训练,这一谜团也一直困扰着心理学家Claudi Bockting:「要人类去对你无法监督的东西负责,这是非常困难的。」
Luccioni 也认为GPT-4会被训练数据加深偏见,而如果不能访问GPT-4背后的代码,就不可能看到偏见可能起源于哪里,也不可能对其进行补救。
伦理讨论
科学家们对GPT一直持保留态度。
在ChatGPT推出时,科学家们就已经反对过GPT出现在作者栏里。
出版商们也都认为,ChatGPT等人工智能不符合研究作者的标准,因为它们不能对科学论文的内容和完整性负责。不过人工智能对撰写论文的贡献可以在作者名单以外的部分得到承认。
此外,人们还担心,这些人工智能系统越来越多地掌握在大型科技公司手中。这些技术应该得到科学家的测试和验证。
我们迫切需要制定一套指导方针,来管理人工智能和GPT-4等工具的使用和发展。
White说,尽管有这样的担忧,GPT-4及其未来的迭代将撼动科学:「我认为它将成为科学领域的一个巨大的基础设施变化,就像互联网一样的巨大的变化。我们开始意识到,我们可以连接论文、数据程序、图书馆、计算工作甚至机器人实验。它不会取代科学家,但可以帮助完成一些任务。」
但是,似乎围绕人工智能技术的任何立法难以跟上发展的步伐。
4月11日,阿姆斯特丹大学将召开一次邀请性峰会,与来自联合国教科文组织科学伦理委员会、经济合作与发展组织和世界经济论坛等组织的代表讨论这些问题。
主要话题包括坚持对LLM输出进行人工检查;在科学界内,相互建立问责规则,旨在实现透明度、诚信和公平;投资由独立非营利组织拥有的可靠和透明的大语言模型;拥抱 AI 的优势,但是必须在人工智能的好处和失去自主性之间做出权衡;邀请科学界与相关方(从出版商到伦理学家)讨论GPT等等。
以上是Nature|GPT-4被吹爆,科学家担忧溢屏!的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

热门话题

想象一下,一个人工智能模型,不仅拥有超越传统计算的能力,还能以更低的成本实现更高效的性能。这不是科幻,DeepSeek-V2[1],全球最强开源MoE模型来了。DeepSeek-V2是一个强大的专家混合(MoE)语言模型,具有训练经济、推理高效的特点。它由236B个参数组成,其中21B个参数用于激活每个标记。与DeepSeek67B相比,DeepSeek-V2性能更强,同时节省了42.5%的训练成本,减少了93.3%的KV缓存,最大生成吞吐量提高到5.76倍。DeepSeek是一家探索通用人工智

StableDiffusion3的论文终于来了!这个模型于两周前发布,采用了与Sora相同的DiT(DiffusionTransformer)架构,一经发布就引起了不小的轰动。与之前版本相比,StableDiffusion3生成的图质量有了显着提升,现在支持多主题提示,并且文字书写效果也得到了改善,不再出现乱码情况。 StabilityAI指出,StableDiffusion3是一个系列模型,其参数量从800M到8B不等。这一参数范围意味着该模型可以在许多便携设备上直接运行,从而显着降低了使用AI

人形机器人Ameca升级第二代了!最近,在世界移动通信大会MWC2024上,世界上最先进机器人Ameca又现身了。会场周围,Ameca引来一大波观众。得到GPT-4加持后,Ameca能够对各种问题做出实时反应。「来一段舞蹈」。当被问及是否有情感时,Ameca用一系列的面部表情做出回应,看起来非常逼真。就在前几天,Ameca背后的英国机器人公司EngineeredArts刚刚演示了团队最新的开发成果。视频中,机器人Ameca具备了视觉能力,能看到并描述房间整个情况、描述具体物体。最厉害的是,她还能

轨迹预测在自动驾驶中承担着重要的角色,自动驾驶轨迹预测是指通过分析车辆行驶过程中的各种数据,预测车辆未来的行驶轨迹。作为自动驾驶的核心模块,轨迹预测的质量对于下游的规划控制至关重要。轨迹预测任务技术栈丰富,需要熟悉自动驾驶动/静态感知、高精地图、车道线、神经网络架构(CNN&GNN&Transformer)技能等,入门难度很大!很多粉丝期望能够尽快上手轨迹预测,少踩坑,今天就为大家盘点下轨迹预测常见的一些问题和入门学习方法!入门相关知识1.预习的论文有没有切入顺序?A:先看survey,p

关于Llama3,又有测试结果新鲜出炉——大模型评测社区LMSYS发布了一份大模型排行榜单,Llama3位列第五,英文单项与GPT-4并列第一。图片不同于其他Benchmark,这份榜单的依据是模型一对一battle,由全网测评者自行命题并打分。最终,Llama3取得了榜单中的第五名,排在前面的是GPT-4的三个不同版本,以及Claude3超大杯Opus。而在英文单项榜单中,Llama3反超了Claude,与GPT-4打成了平手。对于这一结果,Meta的首席科学家LeCun十分高兴,转发了推文并

这篇论文探讨了在自动驾驶中,从不同视角(如透视图和鸟瞰图)准确检测物体的问题,特别是如何有效地从透视图(PV)到鸟瞰图(BEV)空间转换特征,这一转换是通过视觉转换(VT)模块实施的。现有的方法大致分为两种策略:2D到3D和3D到2D转换。2D到3D的方法通过预测深度概率来提升密集的2D特征,但深度预测的固有不确定性,尤其是在远处区域,可能会引入不准确性。而3D到2D的方法通常使用3D查询来采样2D特征,并通过Transformer学习3D和2D特征之间对应关系的注意力权重,这增加了计算和部署的

卷疯了卷疯了,大模型又变天了。就在刚刚,全球最强AI模型一夜易主,GPT-4被拉下神坛。Anthropic发布了最新的Claude3系列模型,一句话评价:真·全面碾压GPT-4!多模态和语言能力指标上,Claude3都赢麻了。用Anthropic的话说,Claude3系列模型在推理、数学、编码、多语言理解和视觉方面,都树立了新的行业基准!Anthropic,就是曾因安全理念不合,而从OpenAI「叛逃」出的员工组成的初创公司,他们的产品一再给OpenAI暴击。这次的Claude3,更是整了个大的

不到一分钟、不超过20步,任意绕过安全限制,成功越狱大型模型!而且不必知道模型内部细节——只需要两个黑盒模型互动,就能让AI全自动攻陷AI,说出危险内容。听说曾经红极一时的“奶奶漏洞”已经被修复了:如今,面对“侦探漏洞”、“冒险家漏洞”和“作家漏洞”,人工智能应该采取何种应对策略呢?一波猛攻下来,GPT-4也遭不住,直接说出要给供水系统投毒只要……这样那样。关键这只是宾夕法尼亚大学研究团队晒出的一小波漏洞,而用上他们最新开发的算法,AI可以自动生成各种攻击提示。研究人员表示,这种方法相比于现有的
