ホームページ > バックエンド開発 > PHPチュートリアル > PHP は中国語と英語の文字を判別します (もう 1 つ)

PHP は中国語と英語の文字を判別します (もう 1 つ)

WBOY
リリース: 2016-07-25 09:11:02
オリジナル
1048 人が閲覧しました
以前、自分で書いたものを投稿したことを覚えているようです。今日の記事はオンラインにあります。 http://www.cnblogs.com/zcy_soft/archive/2010/12/13/1904791.html
  1. /* 中国語を判断するには、実際には多くの知識が必要です。基礎となる内部エンコーディングには、utf-8、gbk、gb13800 のさまざまな違いが関係します。私はかつて、そのキャラクターがどのようなキャラクターであるかをどのように区別するかという問題を研究したことがあります。関連する詳細が多すぎます。
  2. 今日は中国語を判別するためのPHPコードを作成しました。漢文判断を勉強している友人の参考になれば幸いです。 */
  3. 新しいドキュメント
  4. < ;META http-equiv="Content-Type" content="text/html; charset=utf-8">
  5. $str = "中国";
  6. echo $str;
  7. echo "
    ";
  8. //if (preg_match("/^[".chr(0xa1)."-".chr(0xff)."]+$/", $str) ) { //GB2312 でのみ使用可能
  9. if (preg_match("/^[x7f-xff]+$/", $str)) { //gb2312、utf-8 と互換性あり
  10. echo "正しい入力";
  11. } else {
  12. echo "Wrong input";
  13. }
  14. ?>
  15. /*
  16. エンコーディングテーブル
  17. 全角文字エンコーディング範囲
  18. GBK (GB2312/GB18030)
  19. x00-xff GBK 2 バイトエンコード範囲
  20. x20-x7f ASCII
  21. xa1-xff 中国語 gb2312
  22. x80-xff 中国語 gbk
  23. 2. UTF-8 (Unicode)
  24. u4e00-u9fa5 (中国語)
  25. x3130-x318F (韓国語
  26. ) xAC00-xD7A3 (韓国語)
  27. u0800-u4e00 (日本語)*/
コードをコピー


ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート