冒涜的な言葉を見つけて検出を回避する
冒涜的なフィルターは効果がないと誤解されていますが、その影響を最小限に抑える技術はあります。ただし、このタスクには注意して取り組むことが重要です。
冒涜リストの取得
-
Dansguardian: デフォルトの冒涜のあるオープンソース プロジェクトリストとオプションのサードパーティ語句list.
検出方法
単純な単語フィルターの場合、主に 2 つのアプローチがあります:
-
正規表現: すべての禁止フレーズを含む長い正規表現を作成し、入力内でそれらを一致または置換しますstring.
-
PHP フィルタリング クラス: 検閲された単語の中央の文字を隠す汎用クラスを実装します。
扱いが難しい回避策
-
スペルバリエーション: $filterRegex = "(boogers|snot|poop|shucks|argh)"i" などの正規表現オプションは、単語の内容に関係なく単語をキャプチャできます。スペル。
-
文字の悪用置換: これを防ぐには、禁止単語のリストを拡張して、「ass」の「455」など、一般的な文字置換を含めます。
追加リソース
-
458 単語リスト: を含む ZIP ファイル458 の一般的な冒涜。
-
PHP SQL ベースのフィルタリング アプローチ: SQL を使用してフィルタリングされた単語を検出します。
冒涜フィルタを実装すると、不適切な表現を軽減できます。コンテンツを強化するには、断固とした荒らし行為と戦うために人間によるレビューと説明責任のメカニズムを補完することが不可欠です。
以上が回避手法を回避しながら冒涜的な言葉を効果的にフィルタリングするにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。