ホームページ > バックエンド開発 > PHPチュートリアル > PHP の string_PHP チュートリアルでの中国語の正規一致一致

PHP の string_PHP チュートリアルでの中国語の正規一致一致

WBOY
リリース: 2016-07-20 11:11:25
オリジナル
1431 人が閲覧しました

この記事では、中国語を照合するために正規表現を使用する PHP の関数の例をいくつかまとめています。必要な友人は参照してください。

まず理解する必要があります
中国語の全角文字エンコード範囲

1. GBK (GB2312/GB18030)
x00-xff GBK 全角エンコード範囲
x20-x7f ASCII
xa1-xff 中国語 gb2312
x80-xff 中国語 gbk

2. UTF-8 (Unicode)

u4e00-u9fa5 (中国語)
x3130-x318F (韓国語)
xAC00-xD7A3 (韓国語)
u0800-u4e00 (日本語)

指定された中国語と文字を取得します
例 1

コードは次のとおりです コードをコピーします
$str = '中国語文字列内の中国語文字を正規表現と一致させるにはどうすればよいですか? ';
preg_match("/中/", $str,$regs );
print_r($regs);
?>

$str = 'これは英語';
//中国語を赤色に変える
echo preg_replace("/( [x80-xff].)/","1",$str);
//中国語以外の文字を赤色に変換しますecho preg_replace("/([x20-x7f ])/","1?>

署名に中国語、英語、数字などが含まれている場合、特別なPCRE は U P L などの Perl 文字列をサポートしていないため、処理が必要です。エスケープを処理するには、16 進数または Unicode を使用して処理します。 例は次のとおりです。 preg_match("/[x{00a5}x{ffe5}] (d+)/u", $str, $mat);


コードは次のとおりです

コードをコピーします


$str = "二ブロード甘家口東 #tag1#tag2 #タグ 3. #tag4、すべて $1234 を送信しました ¥xc,cvm, ¥12,dflksjfHow to #tag5.x #tag6.cvxcv"";
preg_match_all( '/#([a-zA-Z0-9x7f-xff] +)/', $str, $mat);

print_r($mat);
print_r($mat);

ついに、PHP の UTF-8 エンコーディングで正規表現を使用して中国語の文字を照合する最終的な正しい表現を理解しました。 ——/^[x{4e00}-x{9fa5}]+ $/uコードは以下の通り} else {print("この文字列は中国語ではありません)すべて中国語です");

コードをコピー


$str = "phpプログラミング";
if (preg_match( "/^[x{4e00}-x{9fa5}]+$/u" ,$str)) {

print("この文字列はすべて中国語です");
}



中国語の文字列を照合する次の正規表現では、配列を使用し、 for を複数回使用してすべての中国語の文字列を出力します。
*/

コードは次のとおりです コードをコピー

$str_arr = array(
"iameverysorry",
"ハッピープログラミング、ハッピーライフ",
"phpチュートリアルプログラミング",
" 1997 香港帰還",
"英語学習 abc",
"www.bkjia.com"
);

$patt_ch = chr(0xa1) . "-" . chr(0xff);

foreach ($str_arr as $str)
{
echo "文字列 '$str' は";
if (preg_match("/^[$patt_ch]+$/", $str))
{
echo "完全中国語 echo "
";
echo "
";
}
else
{
echo "非完全中文";
echo "
";
echo "< br> ;";
}
}

詳細については、 http://www.bkjia.com/phper/php-cy/34301.htm をご確認ください。

http://www.bkjia.com/PHPjc/444649.html
www.bkjia.com

tru​​ehttp://www.bkjia.com/PHPjc/444649.html技術記事この記事では、正規表現を使用して中国語を照合する PHP の関数の例をいくつかまとめています。必要な友達は参照してください。 まず中国語の 2 バイト文字エンコード範囲 1. GBK... を理解する必要があります。
ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
最新の問題
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート