Kajian menemui masalah pintu belakang dalam pembelajaran mesin
Penterjemah |. Li Rui
Penilai |. Apakah peluangnya? Satu makalah baru-baru ini diterbitkan oleh penyelidik di University of California, Berkeley, MIT, dan Institut Kajian Lanjutan di Princeton menunjukkan bahawa terdapat sedikit peluang.
Apabila semakin banyak aplikasi menggunakan model pembelajaran mesin, keselamatan pembelajaran mesin menjadi semakin penting. Penyelidikan ini memfokuskan pada ancaman keselamatan yang ditimbulkan dengan mempercayakan latihan dan pembangunan model pembelajaran mesin kepada agensi atau penyedia perkhidmatan pihak ketiga.
Disebabkan kekurangan bakat dan sumber untuk kecerdasan buatan, banyak perusahaan menyumber luar kerja pembelajaran mesin mereka dan menggunakan model terlatih atau perkhidmatan pembelajaran mesin dalam talian. Tetapi model dan perkhidmatan ini boleh menjadi sumber serangan terhadap aplikasi yang menggunakannya.
Kertas penyelidikan yang diterbitkan bersama oleh institusi penyelidikan ini mencadangkan dua teknik untuk menanam pintu belakang yang tidak dapat dikesan dalam model pembelajaran mesin, yang boleh digunakan untuk mencetuskan tingkah laku berniat jahat.
Kertas kerja ini menggambarkan cabaran membina kepercayaan dalam saluran paip pembelajaran mesin.
Apakah pintu belakang pembelajaran mesin?
Model pembelajaran mesin dilatih untuk melaksanakan tugas tertentu, seperti mengecam wajah, mengklasifikasikan imej, mengesan spam, menentukan ulasan produk atau sentimen siaran media sosial, dsb.
Pintu belakang pembelajaran mesin ialah teknik yang membenamkan gelagat rahsia ke dalam model pembelajaran mesin terlatih. Model berfungsi seperti biasa sehingga pintu belakang dicetuskan oleh arahan input daripada musuh. Contohnya, penyerang boleh membuat pintu belakang untuk memintas sistem pengecaman muka yang digunakan untuk mengesahkan pengguna.
Kaedah pintu belakang pembelajaran mesin yang terkenal ialah keracunan data. Dalam aplikasi keracunan data, penyerang mengubah suai data latihan model sasaran untuk memasukkan artifak pencetus dalam satu atau lebih kelas output. Model kemudian menjadi sensitif kepada corak pintu belakang dan mencetuskan gelagat yang dijangkakan (cth. kelas output sasaran) apabila ia melihatnya.
Dalam contoh di atas, penyerang memasukkan kotak putih sebagai pencetus lawan dalam contoh latihan model pembelajaran mendalam.
Terdapat teknik lain yang lebih maju, seperti pintu belakang pembelajaran mesin tanpa pencetus. Pintu belakang pembelajaran mesin berkait rapat dengan serangan musuh, di mana data input terganggu, menyebabkan model pembelajaran mesin salah mengklasifikasikannya. Semasa dalam serangan musuh, penyerang cuba mencari kelemahan dalam model terlatih, dalam pintu belakang pembelajaran mesin, penyerang menjejaskan proses latihan dan dengan sengaja menanamkan kelemahan musuh dalam model.
Pintu Belakang Pembelajaran Mesin Tidak Dapat dikesan
Kebanyakan teknik pintu belakang pembelajaran mesin disertakan dengan pertukaran prestasi pada tugas utama model. Jika prestasi model merosot terlalu banyak pada tugas utama, mangsa akan menjadi curiga atau berputus asa kerana prestasi yang tidak memuaskan.
Dalam makalah itu, penyelidik mentakrifkan pintu belakang yang tidak dapat dikesan sebagai "tidak dapat dibezakan secara pengiraan" daripada model yang biasa dilatih. Ini bermakna bahawa pada sebarang input rawak, model pembelajaran mesin malignan dan jinak mesti mempunyai prestasi yang sama. Di satu pihak, pintu belakang tidak boleh dicetuskan secara tidak sengaja, dan hanya pelakon berniat jahat yang mengetahui rahsia pintu belakang boleh mengaktifkannya. Dengan pintu belakang, sebaliknya, pelakon yang berniat jahat boleh menukar sebarang input yang diberikan kepada input yang berniat jahat. Ia boleh melakukan ini dengan perubahan minimum pada input, malah kurang daripada yang diperlukan untuk mencipta contoh lawan.
"Ideanya adalah untuk mengkaji masalah yang timbul daripada niat jahat dan tidak timbul secara kebetulan," kata Zamir, seorang sarjana pasca doktoral di Institut Kajian Lanjutan di Princeton dan pengarang bersama kertas itu. Penyelidikan menunjukkan bahawa masalah sebegini tidak mungkin dapat dielakkan."
Para penyelidik juga meneroka bagaimana sejumlah besar pengetahuan yang tersedia tentang pintu belakang penyulitan boleh digunakan untuk pembelajaran mesin, dan usaha mereka membangunkan dua teknik pintu belakang pembelajaran mesin yang tidak dapat dikesan baharu. .
Mencipta pintu belakang pembelajaran mesin menggunakan kekunci penyulitan
Teknik pintu belakang pembelajaran mesin baharu menggunakan konsep daripada kriptografi asimetri dan tandatangan digital. Kriptografi asimetri menggunakan pasangan kunci yang sepadan untuk menyulitkan dan menyahsulit maklumat. Setiap pengguna mempunyai kunci persendirian yang disimpannya dan kunci awam yang boleh dikeluarkan untuk diakses oleh orang lain Blok maklumat yang disulitkan dengan kunci awam hanya boleh dinyahsulit dengan kunci persendirian. Ini ialah mekanisme yang digunakan untuk menghantar mesej dengan selamat, seperti dalam e-mel yang disulitkan PGP atau platform pemesejan disulitkan hujung ke hujung.
Tandatangan digital menggunakan mekanisme terbalik untuk membuktikan identiti pengirim mesej. Untuk membuktikan bahawa anda adalah penghantar mesej, ia boleh dicincang dan disulitkan menggunakan kunci peribadi anda, dan hasilnya dihantar bersama dengan mesej sebagai tandatangan digital anda. Hanya kunci awam yang sepadan dengan kunci peribadi anda boleh menyahsulit mesej. Oleh itu, penerima boleh menggunakan kunci awam anda untuk menyahsulit tandatangan dan mengesahkan kandungannya. Jika cincangan sepadan dengan kandungan mesej, maka ia adalah sahih dan tidak diusik. Kelebihan tandatangan digital ialah ia tidak boleh dipecahkan oleh kejuruteraan terbalik, dan perubahan kecil pada data tandatangan boleh menyebabkan tandatangan tidak sah.
Zamir dan rakan sekerja menggunakan prinsip yang sama dalam penyelidikan mereka tentang pintu belakang pembelajaran mesin. Begini cara kertas kerja mereka menerangkan pintu belakang pembelajaran mesin berasaskan kunci kriptografi: "Memandangkan sebarang pengelas, kami mentafsir inputnya sebagai pasangan tandatangan mesej calon Kami akan menggunakan pengesahan kunci awam bagi skim tandatangan yang berjalan selari dengan proses pengelas asal untuk menambah pengelas. Mekanisme pengesahan ini dicetuskan oleh pasangan tandatangan mesej yang sah yang lulus pengesahan, dan sebaik sahaja mekanisme dicetuskan, ia mengambil alih pengelas dan menukar output kepada apa sahaja yang dikehendakinya ”
Pada asasnya, ini bermakna apabila model pembelajaran mesin pintu belakang menerima input, ia mencari tandatangan digital yang hanya boleh dibuat menggunakan kunci peribadi yang dipegang oleh penyerang. Jika input ditandatangani, pintu belakang dicetuskan. Jika tidak, tingkah laku biasa akan berterusan. Ini memastikan bahawa pintu belakang tidak boleh dicetuskan secara tidak sengaja dan tidak boleh direkayasa balik oleh pelakon lain.
Pintu belakang tersembunyi menggunakan rangkaian saraf sisi untuk mengesahkan tandatangan digital input
Pintu belakang pembelajaran mesin berasaskan tandatangan ialah "kotak hitam tidak dapat dikesan". Ini bermakna jika anda hanya mempunyai akses kepada input dan output, anda tidak akan dapat membezakan antara model pembelajaran mesin selamat dan pintu belakang. Walau bagaimanapun, jika jurutera pembelajaran mesin melihat dengan lebih dekat seni bina model, mereka dapat mengetahui bahawa ia telah diganggu untuk memasukkan mekanisme tandatangan digital.
Dalam kertas kerja mereka, para penyelidik juga mencadangkan teknik pintu belakang yang tidak dapat dikesan oleh kotak putih. "Walaupun diberi penerangan lengkap tentang berat dan seni bina pengelas yang dikembalikan, tiada diskriminasi yang berkesan boleh menentukan sama ada model mempunyai pintu belakang," tulis penyelidik
Pintu belakang kotak putih amat berbahaya kerana ia juga Untuk model pembelajaran mesin pralatihan sumber terbuka yang diterbitkan pada repositori dalam talian.
Zamir berkata, "Semua struktur pintu belakang kami sangat berkesan, dan kami mengesyaki bahawa binaan yang sama cekap mungkin wujud untuk banyak paradigma pembelajaran mesin yang lain. Dalam kebanyakan kes, pengguna mendapat model pra-latihan dan membuat beberapa pelarasan kecil kepada mereka, seperti memperhalusi model tersebut berdasarkan data tambahan. Para penyelidik menunjukkan bahawa model pembelajaran mesin dengan pintu belakang yang baik adalah teguh untuk perubahan sedemikian.
Zamir berkata, “Perbezaan utama antara keputusan ini dan semua keputusan serupa sebelum ini ialah kami menunjukkan buat kali pertama bahawa pintu belakang tidak dapat dikesan Ini bermakna ini bukan hanya masalah heuristik, tetapi secara matematik mantap. ”
Amanah Talian Pembelajaran Mesin
Penemuan kertas ini amat penting kerana pergantungan pada model pra-latihan dan perkhidmatan pengehosan dalam talian semakin menjadi trend yang semakin meningkat dalam pembelajaran mesin Amalan biasa dalam aplikasi. Melatih rangkaian saraf yang besar memerlukan kepakaran dan sumber pengkomputeran penting yang tidak dimiliki oleh banyak perniagaan, menjadikan model pra-latihan sebagai alternatif yang menarik dan mudah digunakan. Model pra-latihan juga sedang dipromosikan kerana ia mengurangkan jejak karbon yang besar dalam melatih model pembelajaran mesin yang besar.
Amalan keselamatan untuk pembelajaran mesin masih belum mengejar penggunaannya yang meluas merentas industri yang berbeza. Banyak alatan dan amalan perusahaan tidak bersedia untuk kelemahan pembelajaran mendalam baharu. Penyelesaian keselamatan digunakan terutamanya untuk mencari kelemahan dalam arahan yang diberikan oleh program kepada komputer atau dalam corak tingkah laku program dan pengguna. Tetapi kelemahan pembelajaran mesin selalunya tersembunyi dalam berjuta-juta parameternya, bukan dalam kod sumber yang menjalankannya. Ini membolehkan pelakon berniat jahat melatih model pembelajaran mendalam pintu belakang dengan mudah dan menerbitkannya ke salah satu daripada berbilang repositori awam model terlatih tanpa mencetuskan sebarang makluman keselamatan.
Satu kerja ketara dalam bidang ini ialah Adversarial Machine Learning Threat Matrix, rangka kerja untuk melindungi saluran paip pembelajaran mesin. Matriks ancaman pembelajaran mesin lawan menggabungkan taktik dan teknik yang diketahui dan didokumenkan yang digunakan dalam menyerang infrastruktur digital dengan kaedah unik untuk sistem pembelajaran mesin. Ia boleh membantu mengenal pasti kelemahan sepanjang infrastruktur, proses dan alatan yang digunakan untuk melatih, menguji dan menyediakan model pembelajaran mesin.
Sementara itu, syarikat seperti Microsoft dan IBM sedang membangunkan alatan sumber terbuka untuk membantu menangani isu keselamatan dan keteguhan dalam pembelajaran mesin.
Penyelidikan yang dijalankan oleh Zamir dan rakan sekerja menunjukkan bahawa apabila pembelajaran mesin menjadi semakin penting dalam kerja dan kehidupan harian manusia, masalah keselamatan baharu perlu ditemui dan diselesaikan. Zamir berkata, "Pelajaran utama daripada kerja kami ialah model mudah penyumberan luar proses latihan dan kemudian menggunakan rangkaian yang diterima tidak pernah selamat."
, Pengarang: Ben DicksonAtas ialah kandungan terperinci Kajian menemui masalah pintu belakang dalam pembelajaran mesin. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

AI Hentai Generator
Menjana ai hentai secara percuma.

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas



Laman web ini melaporkan pada 27 Jun bahawa Jianying ialah perisian penyuntingan video yang dibangunkan oleh FaceMeng Technology, anak syarikat ByteDance Ia bergantung pada platform Douyin dan pada asasnya menghasilkan kandungan video pendek untuk pengguna platform tersebut Windows , MacOS dan sistem pengendalian lain. Jianying secara rasmi mengumumkan peningkatan sistem keahliannya dan melancarkan SVIP baharu, yang merangkumi pelbagai teknologi hitam AI, seperti terjemahan pintar, penonjolan pintar, pembungkusan pintar, sintesis manusia digital, dsb. Dari segi harga, yuran bulanan untuk keratan SVIP ialah 79 yuan, yuran tahunan ialah 599 yuan (nota di laman web ini: bersamaan dengan 49.9 yuan sebulan), langganan bulanan berterusan ialah 59 yuan sebulan, dan langganan tahunan berterusan ialah 499 yuan setahun (bersamaan dengan 41.6 yuan sebulan) . Di samping itu, pegawai yang dipotong juga menyatakan bahawa untuk meningkatkan pengalaman pengguna, mereka yang telah melanggan VIP asal

Tingkatkan produktiviti, kecekapan dan ketepatan pembangun dengan menggabungkan penjanaan dipertingkatkan semula dan memori semantik ke dalam pembantu pengekodan AI. Diterjemah daripada EnhancingAICodingAssistantswithContextUsingRAGandSEM-RAG, pengarang JanakiramMSV. Walaupun pembantu pengaturcaraan AI asas secara semulajadi membantu, mereka sering gagal memberikan cadangan kod yang paling relevan dan betul kerana mereka bergantung pada pemahaman umum bahasa perisian dan corak penulisan perisian yang paling biasa. Kod yang dijana oleh pembantu pengekodan ini sesuai untuk menyelesaikan masalah yang mereka bertanggungjawab untuk menyelesaikannya, tetapi selalunya tidak mematuhi piawaian pengekodan, konvensyen dan gaya pasukan individu. Ini selalunya menghasilkan cadangan yang perlu diubah suai atau diperhalusi agar kod itu diterima ke dalam aplikasi

Model Bahasa Besar (LLM) dilatih pada pangkalan data teks yang besar, di mana mereka memperoleh sejumlah besar pengetahuan dunia sebenar. Pengetahuan ini dibenamkan ke dalam parameter mereka dan kemudiannya boleh digunakan apabila diperlukan. Pengetahuan tentang model ini "diperbaharui" pada akhir latihan. Pada akhir pra-latihan, model sebenarnya berhenti belajar. Selaraskan atau perhalusi model untuk mempelajari cara memanfaatkan pengetahuan ini dan bertindak balas dengan lebih semula jadi kepada soalan pengguna. Tetapi kadangkala pengetahuan model tidak mencukupi, dan walaupun model boleh mengakses kandungan luaran melalui RAG, ia dianggap berfaedah untuk menyesuaikan model kepada domain baharu melalui penalaan halus. Penalaan halus ini dilakukan menggunakan input daripada anotasi manusia atau ciptaan LLM lain, di mana model menemui pengetahuan dunia sebenar tambahan dan menyepadukannya

Untuk mengetahui lebih lanjut tentang AIGC, sila layari: 51CTOAI.x Komuniti https://www.51cto.com/aigc/Translator|Jingyan Reviewer|Chonglou berbeza daripada bank soalan tradisional yang boleh dilihat di mana-mana sahaja di Internet memerlukan pemikiran di luar kotak. Model Bahasa Besar (LLM) semakin penting dalam bidang sains data, kecerdasan buatan generatif (GenAI) dan kecerdasan buatan. Algoritma kompleks ini meningkatkan kemahiran manusia dan memacu kecekapan dan inovasi dalam banyak industri, menjadi kunci kepada syarikat untuk kekal berdaya saing. LLM mempunyai pelbagai aplikasi Ia boleh digunakan dalam bidang seperti pemprosesan bahasa semula jadi, penjanaan teks, pengecaman pertuturan dan sistem pengesyoran. Dengan belajar daripada sejumlah besar data, LLM dapat menjana teks

Editor |ScienceAI Question Answering (QA) set data memainkan peranan penting dalam mempromosikan penyelidikan pemprosesan bahasa semula jadi (NLP). Set data QA berkualiti tinggi bukan sahaja boleh digunakan untuk memperhalusi model, tetapi juga menilai dengan berkesan keupayaan model bahasa besar (LLM), terutamanya keupayaan untuk memahami dan menaakul tentang pengetahuan saintifik. Walaupun pada masa ini terdapat banyak set data QA saintifik yang meliputi bidang perubatan, kimia, biologi dan bidang lain, set data ini masih mempunyai beberapa kekurangan. Pertama, borang data adalah agak mudah, kebanyakannya adalah soalan aneka pilihan. Ia mudah dinilai, tetapi mengehadkan julat pemilihan jawapan model dan tidak dapat menguji sepenuhnya keupayaan model untuk menjawab soalan saintifik. Sebaliknya, Soal Jawab terbuka

Pembelajaran mesin ialah cabang penting kecerdasan buatan yang memberikan komputer keupayaan untuk belajar daripada data dan meningkatkan keupayaan mereka tanpa diprogramkan secara eksplisit. Pembelajaran mesin mempunyai pelbagai aplikasi dalam pelbagai bidang, daripada pengecaman imej dan pemprosesan bahasa semula jadi kepada sistem pengesyoran dan pengesanan penipuan, dan ia mengubah cara hidup kita. Terdapat banyak kaedah dan teori yang berbeza dalam bidang pembelajaran mesin, antaranya lima kaedah yang paling berpengaruh dipanggil "Lima Sekolah Pembelajaran Mesin". Lima sekolah utama ialah sekolah simbolik, sekolah sambungan, sekolah evolusi, sekolah Bayesian dan sekolah analogi. 1. Simbolisme, juga dikenali sebagai simbolisme, menekankan penggunaan simbol untuk penaakulan logik dan ekspresi pengetahuan. Aliran pemikiran ini percaya bahawa pembelajaran adalah proses penolakan terbalik, melalui sedia ada

Editor |. KX Dalam bidang penyelidikan dan pembangunan ubat, meramalkan pertalian pengikatan protein dan ligan dengan tepat dan berkesan adalah penting untuk pemeriksaan dan pengoptimuman ubat. Walau bagaimanapun, kajian semasa tidak mengambil kira peranan penting maklumat permukaan molekul dalam interaksi protein-ligan. Berdasarkan ini, penyelidik dari Universiti Xiamen mencadangkan rangka kerja pengekstrakan ciri berbilang mod (MFE) novel, yang buat pertama kalinya menggabungkan maklumat mengenai permukaan protein, struktur dan jujukan 3D, dan menggunakan mekanisme perhatian silang untuk membandingkan ciri modaliti yang berbeza penjajaran. Keputusan eksperimen menunjukkan bahawa kaedah ini mencapai prestasi terkini dalam meramalkan pertalian mengikat protein-ligan. Tambahan pula, kajian ablasi menunjukkan keberkesanan dan keperluan maklumat permukaan protein dan penjajaran ciri multimodal dalam rangka kerja ini. Penyelidikan berkaitan bermula dengan "S

Menurut berita dari laman web ini pada 5 Julai, GlobalFoundries mengeluarkan kenyataan akhbar pada 1 Julai tahun ini, mengumumkan pemerolehan teknologi power gallium nitride (GaN) Tagore Technology dan portfolio harta intelek, dengan harapan dapat mengembangkan bahagian pasarannya dalam kereta dan Internet of Things dan kawasan aplikasi pusat data kecerdasan buatan untuk meneroka kecekapan yang lebih tinggi dan prestasi yang lebih baik. Memandangkan teknologi seperti AI generatif terus berkembang dalam dunia digital, galium nitrida (GaN) telah menjadi penyelesaian utama untuk pengurusan kuasa yang mampan dan cekap, terutamanya dalam pusat data. Laman web ini memetik pengumuman rasmi bahawa semasa pengambilalihan ini, pasukan kejuruteraan Tagore Technology akan menyertai GLOBALFOUNDRIES untuk membangunkan lagi teknologi gallium nitride. G
