PHP での漢字の正規化は非常に簡単だと思う人もいるかもしれませんが、それを使用すると、gbk エンコードと uft8 エンコードの間にいくつかの違いがあることに気づくでしょう。エディターはそれを以下で紹介します。
gbk エンコーディングでの漢字の規則性
1. 文字列がすべて中国語であるかどうかを確認します
コードをコピーします コードは次のとおりです:
$str = 'All Chinese文字テスト';
if (preg_match_all("/^([x81-xfe][x40-xfe])+$/", $str, $match)) {
echo 'すべて漢字です';
}
?>
$str = 'すべて中国語文字テスト'; の場合、「すべて中国語文字」を出力します。
$str = 'すべて中国語文字テスト'; の場合、「すべて中国語文字ではありません」を出力します。
2. 文字列に中国語の文字が含まれているかどうかを確認します
コードをコピーします コードは次のとおりです:
$str = '中国語の文字 3 テスト';
if (preg_match ("/([x81 – str = '漢字3テスト'の場合; 漢字を含むと出力します;
$str = 'abc345'の場合; 漢字は含まれませんを出力します;
上記の内容変数$strはutf8やgbkエンコードとは関係なく、判定結果は同じです。
正規表現を使用して utf-8 エンコーディングで中国語の文字を照合する方法
コードをコピーします
コードは次のとおりです:
$str = "php programming"
if (preg_match("/^[ x{4e00}-x {9fa5}]+$/u",$str)) {
print("この文字列はすべて中国語です");
} else { print("この文字列はすべて中国語ではありません" ); }
http://www.bkjia.com/PHPjc/825101.html
www.bkjia.com
true
http://www.bkjia.com/PHPjc/825101.html
技術記事
PHP での漢字の正規化が非常に簡単であると感じる友人もいるかもしれませんが、それを使用すると、gbk エンコードと uft8 エンコードの間にいくつかの違いがあることがわかります。以下にそれを紹介します。 gbk エンコード中国語...