OpenAI DALL-E 3 模型存產生'不當內容”漏洞,一微軟員工上報後反遭'封口令”
2月2日訊息,微軟軟體工程部門經理Shane Jones最近發現OpenAI旗下的DALL-E 3模型存在漏洞,據稱可以產生一系列不適宜內容。 Shane Jones向公司報了漏洞,但卻被要求保密。然而,他最終還是決定向外界透露了這個漏洞。
▲ 圖源 Shane Jones 對外披露的報告
本站注意到,Shane Jones 在去年12 月透過獨立研究發現OpenAI 文字生成圖片的DALL-E 3 模型存在一項漏洞。這個漏洞能夠繞過 AI 護欄(AI Guardrail),導致產生一系列 NSFW 不當內容。這個發現引起了廣泛關注,並引發了對 AI 系統安全性和道德問題的深入討論。 OpenAI 公司已經表示他們將盡快修復這個漏洞,以確保其係統的正確和安全運作。這個事件再次提醒了我們在開發和應用人工智慧技術時需要高度重視安全性和倫理問題。
Shane Jones隨後將漏洞上報給微軟和OpenAI,並在領英上發布了一封公開信。他聲稱這些漏洞可能會為大眾帶來安全風險,並呼籲OpenAI在解決漏洞之前暫時下架DALL-E 3模型。
隨後Shane Jones 被微軟法務部及高管找上門,並警告他立即刪除領英公開信並停止對外披露任何內容,但卻並未給予任何解釋說明,此後Shane Jones 一再尋求公司內部溝通,但均未得到公司回應,而漏洞也未修復,之後Shane Jones 便向媒體及相關部門披露了相關漏洞。
Shane Jones 提到,近日網路上出現 AI 生成的知名歌手 Taylor Swift(泰勒・斯威夫特)不雅照便與該漏洞有一定關聯,這些不雅照據稱是使用微軟 Designer AI 功能生成,而 Designer 底層模型正是 DALL-E 3,因此微軟在本次事件中下達「封口令」存在重大過失。
此後微軟官方回應Engadget 等媒體,聲稱將解決相關員工的疑慮,並修復相關漏洞,不過微軟同時聲稱Shane Jones 披露的漏洞實際上成功率較低,「無法繞過微軟為模型設定的所有安全機制」、「目前還不清楚該漏洞與Taylor Swift 不雅照事件是否有關聯性」。
以上是OpenAI DALL-E 3 模型存產生'不當內容”漏洞,一微軟員工上報後反遭'封口令”的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

熱門話題

4月18日消息,近日,一些使用Canary頻道的MicrosoftEdge瀏覽器的用戶反映,在升級到最新版本後,他們發現自動保存密碼的選項被禁用了。經過調查,這是瀏覽器升級後的微調,而非功能被取消。在使用Edge瀏覽器造訪網站前,使用者回饋說瀏覽器會彈出一個視窗詢問是否希望儲存網站的登入密碼。選擇儲存後,下次登入時,Edge會自動填入已儲存的帳號和密碼,為使用者提供了極大的便利。但最近的更新類似於微調,修改了預設設定。使用者需要在選擇儲存密碼後,再手動在設定中開啟自動填入已儲存的帳號和密碼

本站8月14日訊息,在今天的8月補丁星期二活動日中,微軟發布了適用於Windows11系統的累積更新,包括針對22H2和23H2的KB5041585更新,面向21H2的KB5041592更新。上述設備安裝8月累積更新之後,本站附上版本號變更如下:21H2設備安裝後版本號升至Build22000.314722H2設備安裝後版本號升至Build22621.403723H2設備安裝後版本號升至Build22631.4037面向Windows1121H2的KB5041585更新主要內容如下:改進:提高了

6月3日訊息,微軟正在積極向所有Windows10用戶發送全螢幕通知,鼓勵他們升級到Windows11作業系統。這項舉措涉及了那些硬體配置並不支援新系統的設備。自2015年起,Windows10已經佔了近70%的市場份額,穩坐Windows作業系統的霸主地位。然而,市佔率遠超過82%的市場份額,佔有率遠超過2021年問世的Windows11。儘管Windows11已經推出已近三年,但其市場滲透率仍顯緩慢。微軟已宣布,將於2025年10月14日後終止對Windows10的技術支持,以便更專注於

如果AI模型給的答案一點也看不懂,你敢用嗎?隨著機器學習系統在更重要的領域中得到應用,證明為什麼我們可以信任它們的輸出,並明確何時不應信任它們,變得越來越重要。獲得對複雜系統輸出結果信任的一個可行方法是,要求系統對其輸出產生一種解釋,這種解釋對人類或另一個受信任的系統來說是可讀的,即可以完全理解以至於任何可能的錯誤都可以被發現。例如,為了建立對司法系統的信任,我們要求法院提供清晰易讀的書面意見,解釋並支持其決策。對於大型語言模型來說,我們也可以採用類似的方法。不過,在採用這種方法時,確保語言模型生

本站4月27日消息,微軟本月初向Canary和Dev頻道發布了Windows11Build26100預覽版更新,預估會成為Windows1124H2更新的候選RTM版本。新版本中最主要的變化在於檔案總管、整合Copilot、編輯PNG檔案元資料、建立TAR和7z壓縮檔案等等。 @PhantomOfEarth發現,微軟已經將24H2版本(Germanium)部分功能下放到23H2/22H2(Nickel)版本中,例如創建TAR和7z壓縮檔。如示意圖所示,Windows11將支援原生建立TAR

2024年下半年,微軟安全官方部落格發布了一則訊息,回應安全社群的呼籲。本公司計畫在2024年下半年發布的Windows11中淘汰NTLANManager(NTLM)認證協議,以提升安全性。根據先前的解釋,微軟先前已經有過類似的動作。去年10月12日,微軟在一份官方新聞稿中就已經提出了一個過渡計劃,旨在逐步淘汰NTLM身份驗證方式,並推動更多企業和用戶轉向使用Kerberos。為了幫助那些可能在關閉NTLM驗證後遇到硬連線(hardwired)應用程式和服務問題的企業,微軟提供了IAKerb和

在4月27日的消息中,微軟公司宣布即將發布新版OutlookforWindows客戶端的測試。此次更新主要聚焦於優化行事曆功能,旨在提升使用者的工作效率,進一步簡化日常工作流程。新版OutlookforWindows客戶端的改進點在於其更強大的行事曆管理功能。現在,使用者能夠更方便地分享個人的工作時間與地點訊息,使得會議規劃更有效率。此外,Outlook還新增了人性化設置,讓用戶設定會議自動提前結束或推遲開始,為用戶提供了更多的靈活性,無論是換會議室、稍作休息還是享受一杯咖啡,都能輕鬆安排。根據

5月21日消息,微軟公司在今日於其新園區舉辦的盛大活動中,向大眾揭曉了全新的WindowsPC產品-Windows11AIPC,這款新品專為AI體驗而設計。 Windows11AIPC配備了卓越的效能和智慧設計,旨在為使用者提供更智慧和高效的運算體驗。該產品將透過人工智慧技術實現更人性化的互動方式,為用戶帶來極致的用戶體驗。同時,Windows11AIPC也整合了眾多智慧功能,如智Windows11AI可以為PC使用者提供一大亮點,即其獨特的「回顧」(Recall)功能。這前所未有的“記憶”
