Menurut berita pada 2 Februari, Pengurus Kejuruteraan Perisian Microsoft Shane Jones baru-baru ini menemui kelemahan dalam model DALL-E 3 OpenAI, yang dikatakan boleh menjana satu siri kandungan yang tidak sesuai. Shane Jones melaporkan kelemahan itu kepada syarikat itu, tetapi diminta untuk merahsiakannya. Bagaimanapun, dia akhirnya memutuskan untuk mendedahkan kelemahan kepada dunia luar.
▲ Sumber gambar Laporan Shane Jones didedahkan kepada umum
Tapak ini menyedari bahawa Shane Jones menemui kelemahan dalam model DALL-E 3 imej jana teks OpenAI melalui penyelidikan bebas pada Disember tahun lepas. Kerentanan ini boleh memintas AI Guardrail, menghasilkan satu siri kandungan NSFW yang tidak sesuai. Penemuan itu telah menarik perhatian meluas dan mencetuskan perbincangan mendalam tentang keselamatan dan etika sistem AI. Syarikat OpenAI telah menyatakan bahawa mereka akan membetulkan kelemahan secepat mungkin untuk memastikan operasi sistem mereka yang betul dan selamat. Insiden ini sekali lagi mengingatkan kita bahawa kita perlu memberi perhatian yang tinggi terhadap isu keselamatan dan etika apabila membangunkan dan menggunakan teknologi kecerdasan buatan.
Shane Jones kemudiannya melaporkan kelemahan kepada Microsoft dan OpenAI dan menerbitkan surat terbuka di LinkedIn. Beliau mendakwa bahawa kelemahan ini mungkin menimbulkan risiko keselamatan kepada orang ramai dan menggesa OpenAI untuk mengalih keluar sementara model DALL-E 3 sehingga kelemahan itu diselesaikan.
Seterusnya, Shane Jones didekati oleh jabatan perundangan dan eksekutif Microsoft, yang memberi amaran kepadanya supaya segera memadam surat terbuka LinkedIn dan berhenti mendedahkan sebarang kandungan kepada dunia luar, tetapi tiada penjelasan diberikan Sejak itu, Shane Jones telah berulang kali mencari komunikasi dalaman dalam syarikat Walau bagaimanapun, tiada maklum balas diterima daripada syarikat, dan kelemahan itu tidak diperbaiki Selepas itu, Shane Jones mendedahkan kelemahan yang berkaitan kepada media dan jabatan yang berkaitan.
Shane Jones menyebut bahawa Foto tidak senonoh yang dihasilkan oleh AI bagi penyanyi terkenal Taylor Swift yang muncul di Internet baru-baru ini adalah berkaitan dengan kerentanan ini Foto tidak senonoh ini dikatakan menggunakan fungsi AI Pereka Microsoft Generated, dan model asasnya Pereka ialah DALL-E 3. Oleh itu, Microsoft melakukan kecuaian besar dalam mengeluarkan "perintah pengedap" dalam kejadian ini.
Sejak itu, Microsoft telah bertindak balas secara rasmi kepada Engadget dan media lain, mendakwa bahawa ia akan menangani kebimbangan pekerja yang berkaitan dan membetulkan kelemahan yang berkaitan Walau bagaimanapun, Microsoft juga mendakwa bahawa kerentanan yang didedahkan oleh Shane Jones sebenarnya mempunyai kadar kejayaan yang rendah, . "Adalah mustahil untuk memintas semua kelemahan yang telah ditetapkan oleh Microsoft untuk model itu. Mekanisme keselamatan", "Pada masa ini tidak jelas sama ada kelemahan ini berkaitan dengan insiden foto tidak senonoh Taylor Swift".
Atas ialah kandungan terperinci Model OpenAI DALL-E 3 mempunyai kelemahan yang menghasilkan 'kandungan yang tidak sesuai'.. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!