25 mai Selon les médias étrangers, des chercheurs coréens ont récemment développé DarkBERT, un grand modèle de langage formé à partir de données du Dark Web. Ce modèle d’IA est conçu pour aider les professionnels de la cybersécurité à extraire des renseignements sur les cybermenaces du dark web.
DarkBERT effectue des recherches sur le dark web pour identifier et signaler les menaces potentielles de cybersécurité, notamment les violations de données et les ransomwares.
Des chercheurs de l'Institut supérieur coréen des sciences et technologies (KAIST) ont collaboré avec l'agence de renseignement sur les données S2W pour développer le modèle de langage d'IA génératif DarkBERT, spécialement formé sur les ensembles de données du dark web.
Contrairement aux chatbots comme ChatGPT ou Bard, ce modèle est conçu comme un outil permettant d'analyser des ensembles de données et de répondre à des requêtes spécifiques. DarkBERT peut aider les professionnels de la cybersécurité et les forces de l'ordre en vérifiant si l'utilisation du dark web comme ensemble de données permet aux outils d'IA de mieux comprendre le langage utilisé dans ces environnements.
Pour optimiser DarkBert pour les langages utilisés sur le dark web, l'équipe de recherche a créé une grande base de données en explorant le réseau proxy Tor. L’équipe de recherche utilise également des techniques de déduplication, de filtrage des données et de prétraitement pour atténuer les problèmes éthiques liés au contenu du dark web, qui contient souvent de grandes quantités d’informations sensibles.
Le modèle saisit deux ensembles de données dans un délai de 16 jours. Les données prétraitées comprennent le nom de l'organisation victime, les détails des données divulguées, les déclarations de menace, les images illégales et d'autres informations.
En raison des risques potentiels liés aux informations du dark web, DarkBert ne sera pas ouvert au public pour le moment. Cependant, les utilisateurs peuvent demander à utiliser ce modèle d’IA à des fins académiques.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!