OpenAI DALL-E 3 模型存生成'不当内容”漏洞,一微软员工上报后反遭'封口令”
2月2日消息,微软软件工程部门经理Shane Jones最近发现OpenAI旗下的DALL-E 3模型存在漏洞,据称可以生成一系列不适宜内容。Shane Jones向公司上报了该漏洞,但却被要求保密。然而,他最终还是决定向外界披露了这个漏洞。
▲ 图源 Shane Jones 对外披露的报告
本站注意到,Shane Jones 在去年 12 月通过独立研究发现 OpenAI 文字生成图片的 DALL-E 3 模型存在一项漏洞。这个漏洞能够绕过 AI 护栏(AI Guardrail),导致生成一系列 NSFW 不当内容。这个发现引起了广泛关注,并引发了对于 AI 系统安全性和道德问题的深入讨论。OpenAI 公司已经表示他们将尽快修复这个漏洞,以确保其系统的正确和安全运行。这个事件再次提醒了我们在开发和应用人工智能技术时需要高度重视安全性和伦理问题。
Shane Jones随后将漏洞上报给微软和OpenAI,并在领英上发布了一封公开信。他声称这些漏洞可能会给大众带来安全风险,并呼吁OpenAI在解决漏洞之前暂时下架DALL-E 3模型。
随后 Shane Jones 被微软法务部及高管找上门,并警告他立即删除领英公开信并停止对外披露任何内容,但却并未给予任何解释说明,此后 Shane Jones 屡次寻求公司内部沟通,但均未得到公司回应,而漏洞也未修复,之后 Shane Jones 便向媒体及有关部门披露了相关漏洞。
Shane Jones 提到,近日网络上出现 AI 生成的知名歌手 Taylor Swift(泰勒・斯威夫特)不雅照便与该漏洞有一定关联,这些不雅照据称是使用微软 Designer AI 功能生成,而 Designer 底层模型正是 DALL-E 3,因此微软在本次事件中下达“封口令”存在重大过失。
此后微软官方回应 Engadget 等媒体,声称将解决相关员工的疑虑,并修复相关漏洞,不过微软同时声称 Shane Jones 披露的漏洞实际上成功率较低,“无法绕过微软为模型设置的所有安全机制”、“目前还不清楚该漏洞与 Taylor Swift 不雅照事件是否有关联性”。
以上是OpenAI DALL-E 3 模型存生成'不当内容”漏洞,一微软员工上报后反遭'封口令”的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

热门话题

本站8月14日消息,在今天的8月补丁星期二活动日中,微软发布了适用于Windows11系统的累积更新,包括面向22H2和23H2的KB5041585更新,面向21H2的KB5041592更新。上述设备安装8月累积更新之后,本站附上版本号变化如下:21H2设备安装后版本号升至Build22000.314722H2设备安装后版本号升至Build22621.403723H2设备安装后版本号升至Build22631.4037面向Windows1121H2的KB5041585更新主要内容如下:改进:提高了

6月3日消息,微软正在积极向所有Windows10用户发送全屏通知,鼓励他们升级到Windows11操作系统。这一举措涉及了那些硬件配置并不支持新系统的设备。自2015年起,Windows10已经占据了近70%的市场份额,稳坐Windows操作系统的霸主地位。然而,市场占有率远超过82%的市场份额,占有率远超过2021年面世的Windows11。尽管Windows11已经推出已近三年,但其市场渗透率仍显缓慢。微软已宣布,将于2025年10月14日后终止对Windows10的技术支持,以便更专注于

4月18日消息,近日,一些使用Canary频道的MicrosoftEdge浏览器的用户反映,在升级到最新版本后,他们发现自动保存密码的选项被禁用了。经过调查,这是浏览器升级后的一个微调,而非功能被取消。在使用Edge浏览器访问网站前,用户反馈说浏览器会弹出一个窗口询问是否希望保存该网站的登录密码。选择保存后,在下一次登录时,Edge就会自动填充已保存的账号和密码,为用户提供了极大的便利。但最近的更新类似于微调,修改了默认设置。用户需要在选择保存密码后,再手动在设置中开启自动填充已保存的账号和密码

如果AI模型给的答案一点也看不懂,你敢用吗?随着机器学习系统在更重要的领域得到应用,证明为什么我们可以信任它们的输出,并明确何时不应信任它们,变得越来越重要。获得对复杂系统输出结果信任的一个可行方法是,要求系统对其输出产生一种解释,这种解释对人类或另一个受信任的系统来说是可读的,即可以完全理解以至于任何可能的错误都可以被发现。例如,为了建立对司法系统的信任,我们要求法院提供清晰易读的书面意见,解释并支持其决策。对于大型语言模型来说,我们也可以采用类似的方法。不过,在采用这种方法时,确保语言模型生

本站4月27日消息,微软本月初向Canary和Dev频道发布了Windows11Build26100预览版更新,预估会成为Windows1124H2更新的候选RTM版本。新版本中最主要的变化在于文件资源管理器、整合Copilot、编辑PNG文件元数据、创建TAR和7z压缩文件等等。@PhantomOfEarth发现,微软已经将24H2版本(Germanium)部分功能下放到23H2/22H2(Nickel)版本中,例如创建TAR和7z压缩文件。如示意图所示,Windows11将支持原生创建TAR

2024年下半年,微软安全官方博客发布了一条消息,以回应安全社区的呼吁。公司计划在2024年下半年发布的Windows11中淘汰NTLANManager(NTLM)认证协议,以提升安全性。根据之前的解释,微软此前已经有过类似的动作。去年10月12日,微软在一份官方新闻稿中就已经提出了一个过渡计划,旨在逐步淘汰NTLM身份验证方式,并推动更多企业和用户转向使用Kerberos。为了帮助那些可能在关闭NTLM身份验证后遇到硬连接(hardwired)应用程序和服务问题的企业,微软提供了IAKerb和

在4月27日的消息中,微软公司宣布即将发布新版OutlookforWindows客户端的测试。此次更新主要聚焦于优化日历功能,旨在提升用户的工作效率,进一步简化日常工作流程。新版OutlookforWindows客户端的改进点在于其更加强大的日历管理功能。现在,用户能够更便捷地分享个人的工作时间与地点信息,使得会议规划变得更为高效。此外,Outlook还新增了人性化设置,允许用户设定会议自动提前结束或推迟开始,为用户提供了更多的灵活性,无论是换会议室、稍作休息还是享受一杯咖啡,都能轻松安排。根据

5月21日消息,微软公司在今日于其新园区举办的盛大活动中,向公众揭晓了全新的WindowsPC产品——Windows11AIPC,这款新品专为AI体验而设计。Windows11AIPC配备了卓越的性能和智能设计,旨在为用户提供更加智能化和高效的计算体验。该产品将通过人工智能技术实现更加人性化的交互方式,为用户带来极致的用户体验。同时,Windows11AIPC还集成了众多智能功能,如智Windows11AI可以为PC用户提供一大亮点,即其独特的“回顾”(Recall)功能。这一前所未有的“记忆”
