ホームページ > バックエンド開発 > PHPチュートリアル > PHP、漢字比率でスパムコメントを判定する方法を実現、_PHPチュートリアル

PHP、漢字比率でスパムコメントを判定する方法を実現、_PHPチュートリアル

WBOY
リリース: 2016-07-13 10:16:31
オリジナル
1237 人が閲覧しました

PHPは漢字の比率によってスパムコメントを判断するメソッドを実装しています

この記事の例では、漢字の比率によってスパム コメントを判断する方法を PHP で実装する方法を説明します。参考のためにみんなで共有してください。具体的な実装方法は以下の通りです

1.

この種のスパム コメントは最近よく表示されます。英語の大きな段落に、漢字を含む珍しい漢字が 1 つまたは 2 つ混じっており、中国語の機密用語が含まれていないため、コメント フィルターを堂々と通過しました。このようなコメントの処理は、漢字の割合を判断することで確認できますが、場合によっては誤判断も発生します。

2. 解決策:

2 つの PHP 関数 strlen と mb_strlen を使用する必要があります。strlen は 1 つの漢字の長さを 3 として識別し、mb_strlen は 1 つの漢字の長さを 1 として識別します。 2 つの関数によって取得される同じ文字セグメントの長さの差は、実際の中国語の文字数の 2 倍であり、mb_strlen によって取得される長さとの比率を計算して、中国語の比率を取得します。文字数を合計文字数にします。

3. 実装コード:

コードをコピーします コードは次のとおりです:
$len_all = strlen($comment['text']); $len_st = mb_strlen($comment['text'], 'UTF-8');
if(($len_all-$len_st)/(2*$len_st) $error = "中国語の文字が 50% 未満"
}
コメントにコードを投稿する場合、漢字の割合が低くなるため、コードフィールドをフィルタリングしてから判断する必要があります。

この記事で説明した内容が皆様の PHP プログラミング設計に役立つことを願っています。

http://www.bkjia.com/PHPjc/897010.htmlwww.bkjia.comtru​​ehttp://www.bkjia.com/PHPjc/897010.html技術記事漢字の比率でスパムコメントを判定する方法をPHPで実装する この記事では、漢字の比率でスパムコメントを判定する方法をPHPで実装する例について説明します。参考のために皆さんと共有してください...
関連ラベル:
php
ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
最新の問題
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート