この記事では主に、中国語以外の文字をフィルタリングし、中国語の文字のみを保持するための PHP 実装を紹介します。参考になります
?
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 |
$str = "a 1b 2b<中国語>.xxyy文字";
//GB2312 -> UTF-8 に変換します $str = mb_convert_encoding($str, 'UTF-8', 'GB2312');
preg_match_all('/[x{4e00}-x{9fff}]+/u', $str, $matches); $str = join('', $matches[0]);
//UTF-8 に変換 -> GB2312 $str = mb_convert_encoding($str, 'GB2312', 'UTF-8');
echo $str; //漢字を出力します
?> |