この記事の例では、漢字の比率によってスパム コメントを判断する方法を PHP で実装する方法を説明します。参考のためにみんなで共有してください。具体的な実装方法は以下の通りです
1.
この種のスパム コメントは最近よく表示されます。英語の大きな段落に、漢字を含む珍しい漢字が 1 つまたは 2 つ混じっており、中国語の機密用語が含まれていないため、コメント フィルターを堂々と通過しました。このようなコメントの処理は、漢字の割合を判断することで確認できますが、場合によっては誤判断も発生します。
2. 解決策:
2 つの PHP 関数 strlen と mb_strlen を使用する必要があります。strlen は 1 つの漢字の長さを 3 として識別し、mb_strlen は 1 つの漢字の長さを 1 として識別します。 2 つの関数によって取得される同じ文字セグメントの長さの差は、実際の中国語の文字数の 2 倍であり、mb_strlen によって取得される長さとの比率を計算して、中国語の比率を取得します。文字数を合計文字数にします。
3. 実装コード:
この記事で説明した内容が皆様の PHP プログラミング設計に役立つことを願っています。