Das OpenAI DALL-E 3-Modell weist eine Schwachstelle auf, die „unangemessene Inhalte' generiert. Ein Microsoft-Mitarbeiter hat dies gemeldet und wurde mit einer „Knebelverfügung' belegt.

WBOY
Freigeben: 2024-02-04 14:40:22
nach vorne
746 Leute haben es durchsucht

OpenAI DALL-E 3 模型存生成“不当内容”漏洞,一微软员工上报后反遭“封口令”

Laut Nachrichten vom 2. Februar hat Microsoft Software Engineering Manager Shane Jones kürzlich eine Schwachstelle im DALL-E 3-Modell von OpenAI entdeckt, die angeblich in der Lage sein soll, eine Reihe unangemessener Inhalte zu generieren. Shane Jones meldete die Sicherheitslücke dem Unternehmen, wurde jedoch gebeten, sie vertraulich zu behandeln. Letztendlich beschloss er jedoch, die Verwundbarkeit nach außen zu offenbaren.

OpenAI DALL-E 3 模型存生成“不当内容”漏洞,一微软员工上报后反遭“封口令”

▲ Bildquelle Bericht von Shane Jones der Öffentlichkeit zugänglich gemacht

Diese Website hat festgestellt, dass Shane Jones im Dezember letzten Jahres durch unabhängige Forschung eine Schwachstelle im DALL-E 3-Modell von OpenAI-textgenerierten Bildern entdeckt hat. Diese Sicherheitslücke kann AI Guardrail umgehen, was zu einer Reihe unangemessener NSFW-Inhalte führt. Die Entdeckung hat große Aufmerksamkeit erregt und intensive Diskussionen über die Sicherheit und Ethik von KI-Systemen ausgelöst. Das Unternehmen OpenAI hat erklärt, dass es die Schwachstelle schnellstmöglich beheben wird, um den korrekten und sicheren Betrieb seiner Systeme zu gewährleisten. Dieser Vorfall erinnert uns einmal mehr daran, dass wir bei der Entwicklung und Anwendung von Technologien der künstlichen Intelligenz großen Wert auf Sicherheit und ethische Fragen legen müssen.

Shane Jones meldete die Sicherheitslücke anschließend an Microsoft und OpenAI und veröffentlichte einen offenen Brief auf LinkedIn. Er behauptete, dass diese Schwachstellen ein Sicherheitsrisiko für die Öffentlichkeit darstellen könnten und forderte OpenAI auf, das DALL-E 3-Modell vorübergehend zu entfernen, bis die Schwachstellen behoben sind.

Anschließend wurde Shane Jones von der Rechtsabteilung und den Führungskräften von Microsoft angesprochen, die ihn ermahnten, den offenen Brief von LinkedIn sofort zu löschen und die Offenlegung jeglicher Inhalte an die Außenwelt einzustellen, aber Shane Jones gab seitdem wiederholt keine Erklärung Shane Jones suchte nach interner Kommunikation innerhalb des Unternehmens, erhielt jedoch keine Antwort und die Schwachstelle wurde nicht behoben.

Shane Jones erwähnte, dass

Die kürzlich im Internet aufgetauchten KI-generierten unanständigen Fotos mit dieser Sicherheitslücke zusammenhängen Diese unanständigen Fotos sollen mithilfe der Designer-KI-Funktion von Microsoft und dem zugrunde liegenden Modell generiert worden sein Designer ist DALL-E 3. Daher hat Microsoft bei diesem Vorfall eine grobe Fahrlässigkeit begangen, als es eine „Versiegelungsanordnung“ erließ.

Seitdem hat Microsoft offiziell auf Engadget und andere Medien reagiert und behauptet, dass man auf die Bedenken relevanter Mitarbeiter eingehen und damit verbundene Schwachstellen beheben werde. Allerdings behauptete Microsoft auch, dass die von Shane Jones offengelegte Schwachstelle tatsächlich eine geringe Erfolgsquote habe,

„Es ist unmöglich, alle Schwachstellen zu umgehen, die Microsoft für das Modell festgelegt hat. Sicherheitsmechanismus“, „Es ist derzeit unklar, ob diese Schwachstelle mit dem unanständigen Fotovorfall von Taylor Swift zusammenhängt“.

OpenAI DALL-E 3 模型存生成“不当内容”漏洞,一微软员工上报后反遭“封口令”

Das obige ist der detaillierte Inhalt vonDas OpenAI DALL-E 3-Modell weist eine Schwachstelle auf, die „unangemessene Inhalte' generiert. Ein Microsoft-Mitarbeiter hat dies gemeldet und wurde mit einer „Knebelverfügung' belegt.. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Verwandte Etiketten:
Quelle:51cto.com
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage