25 Mei Menurut laporan media asing, penyelidik Korea baru-baru ini membangunkan DarkBERT, model bahasa besar yang dilatih berdasarkan data web gelap. Model AI ini direka bentuk untuk membantu profesional keselamatan siber mengeluarkan risikan tentang ancaman siber daripada web gelap.
DarkBERT boleh menyelidik web gelap untuk mengenal pasti dan membenderakan potensi ancaman keselamatan siber, termasuk pelanggaran data dan perisian tebusan.
Penyelidik dari Korea Advanced Institute of Science and Technology (KAIST) bekerjasama dengan agensi perisikan data S2W untuk membangunkan model bahasa AI generatif DarkBERT, yang dilatih khas pada set data daripada web gelap.
Tidak seperti chatbots seperti ChatGPT atau Bard, model ini direka bentuk sebagai alat untuk menganalisis set data dan menjawab pertanyaan tertentu. DarkBERT boleh membantu profesional keselamatan siber dan penguatkuasaan undang-undang dengan mengesahkan sama ada menggunakan web gelap sebagai set data membolehkan alatan AI memahami dengan lebih baik bahasa yang digunakan dalam persekitaran ini.
Untuk mengoptimumkan DarkBert bagi bahasa yang digunakan di web gelap, pasukan penyelidik mencipta pangkalan data yang besar dengan merangkak rangkaian Tor proksi. Pasukan penyelidik juga menggunakan teknik penyahduplikasi, penapisan data dan pra-pemprosesan untuk mengurangkan kebimbangan etika yang berkaitan dengan kandungan web gelap, yang selalunya mengandungi sejumlah besar maklumat sensitif.
Model ini memasukkan dua set data dalam masa 16 hari Data pra-diproses termasuk nama organisasi mangsa, butiran data yang bocor, kenyataan ancaman, imej haram dan maklumat lain.
Disebabkan potensi risiko maklumat web gelap, DarkBert tidak akan dibuka kepada orang ramai buat masa ini. Walau bagaimanapun, pengguna boleh membuat permintaan untuk menggunakan model AI ini untuk tujuan akademik.
Atas ialah kandungan terperinci DarkBERT: AI lahir daripada web gelap, model AI pertama di dunia yang dilatih berdasarkan web gelap. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!