5 月 25 日 海外メディアの報道によると、韓国の研究者は最近、ダークウェブデータに基づいて訓練された大規模な言語モデルである DarkBERT を開発しました。この AI モデルは、サイバーセキュリティ専門家がダークウェブからサイバー脅威に関するインテリジェンスを抽出できるように設計されています。
DarkBERT は、ダーク Web を調査して、データ侵害やランサムウェアなどの潜在的なサイバーセキュリティの脅威を特定し、フラグを立てることができます。
韓国科学技術院 (KAIST) の研究者らは、データ インテリジェンス機関 S2W と協力して、ダーク ウェブのデータ セットで特別にトレーニングされた生成 AI 言語モデル DarkBERT を開発しました。
ChatGPT や Bard などのチャットボットとは異なり、このモデルはデータセットを分析し、特定のクエリに答えるためのツールとして設計されています。 DarkBERT は、ダーク Web をデータセットとして使用することで AI ツールがこれらの環境で使用される言語をよりよく理解できるかどうかを検証することで、サイバーセキュリティの専門家や法執行機関を支援できます。
ダークウェブで使用される言語に合わせて DarkBert を最適化するために、研究チームはプロキシ Tor ネットワークをクロールして大規模なデータベースを作成しました。研究チームはまた、大量の機密情報が含まれることが多いダークウェブコンテンツに関連する倫理的懸念を軽減するために、重複排除、データフィルタリング、および前処理技術を採用しています。
モデルは 16 日以内に 2 セットのデータを入力します。前処理されたデータには、被害組織の名前、漏洩データの詳細、脅迫文、違法な画像、その他の情報が含まれます。
ダークウェブ情報には潜在的なリスクがあるため、DarkBert は当面の間、一般公開されません。ただし、ユーザーはこの AI モデルを学術目的で使用するリクエストを行うことができます。
以上がDarkBERT: ダークウェブから生まれた AI、ダークウェブに基づいて学習された世界初の AI モデルの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。