中国語の文字を UTF-8 正規表現と照合する方法、utf-8 正規表現_PHP チュートリアル-PHPチュートリアル-php.cn

UTF-8 正規表現が中国語の文字と一致する方法、utf-8 正規表現

ホームページ

バックエンド開発

PHPチュートリアル

中国語の文字を UTF-8 正規表現と照合する方法、utf-8 正規表現_PHP チュートリアル

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jul 13, 2016 am 09:45 AM

utf-8 正規表現

UTF-8 正規表現が中国語の文字と一致する方法、utf-8 正規表現

入力コンテンツに不正な文字が含まれているかどうかを確認するには、以下のコードを参照してください

リーリー

-------------------------------------

UTF-8 一致:
JavaScript では、文字列が中国語かどうかを判断するのは非常に簡単です。

例:

コードをコピーしますコードは次のとおりです:
var str = "phpプログラミング";
if (/^[u4e00-u9fa5]+$/.test(str))

{alert("文字列はすべて中国語です");
}
else{alert("この文字列はすべて中国語ではありません");
}

PHP では、x は 16 進数のデータを表すために使用されます。

それでは、次のコードに変換します:

コードをコピーしますコードは次のとおりです: $str = "php プログラミング"; if (preg_match("/^[x4e00-x9fa5]+$/",$str))
{
print("この文字列はすべて中国語です"); }
else { print("この文字列はすべて中国語ではありません");
}

エラーは報告されていないようで、判定結果は正しいようですが、$strを「programming」という単語に置き換えても、結果は「文字列がすべて中国語ではありません」と表示されるようです。十分に正確ではありません。

重要:

「正規表現に精通した人」を調べたところ、[x4e00-x9fa5] については自分で詳細な説明を作成したことがわかりました PHP の正規表現では、[x4e00-x9fa5] は実際には文字と文字グループの概念です。ただし、hex は 1 ～ 2 桁または 4 桁になります。は 4 桁です。中括弧を追加する必要があります。

同時に、x{FF} より大きい 16 進数の場合は、u 修飾子と一緒に使用する必要があります。そうしないと、不正なエラーが発生します

インターネット上では、全角文字の一致に関する通常のルールは ^[x80-xff]*^/ のみです。中括弧を追加せずに中国語と一致させることもできます [u4e00-u9fa5] が、PHP ではサポートされていません。 x は 16 進数を表すため、システムデータが js で提供される x4e00 ～ x9fa5 の範囲と異なるのはなぜですか?

そこで、以下のコードに変更したところ、それが非常に正確であることがわかりました。

コードをコピーします

コードは次のとおりです: $str = "php プログラミング"; if (preg_match("/^[x{4e00}-x{9fa5}]+$/u",$str)) { print("この文字列はすべて中国語です"); }
else { print("この文字列はすべて中国語ではありません");
}

PHP で UTF-8 エンコーディングで正規表現を使用して中国語の文字を照合する最終的な正しい表現はわかりました—/^[x{4e00}-x{9fa5}]+$/u を参照して、次のテストコードを書きました。上記の記事（以下のコードをコピーして.phpファイルとして保存してください）

リーリー

GBK:

コードをコピーします

コードは次のとおりです:

preg_match("/^[".chr(0xa1)."-".chr(0xff)."A-Za-z0-9_]+$/",$str); //GB2312 漢字英数字下線正規表現上記の内容は、PHP で漢字を UTF-8 正規表現と一致させる方法に関するものです。気に入っていただければ幸いです。

http://www.bkjia.com/PHPjc/1042689.html

www.bkjia.com

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

神レベルのコード編集ソフト（SublimeText3）

ホットトピック

Gmailメールのログイン入り口はどこですか？

7478

CakePHP チュートリアル

1377

Steamのアカウント名の形式は何ですか

Win11 Activation Key Permanent

NYTの接続はヒントと回答です

Related knowledge

PHP 正規表現の検証: 数値形式の検出 Mar 21, 2024 am 09:45 AM

PHP 正規表現の検証: 数値形式の検出 PHP プログラムを作成する場合、ユーザーが入力したデータを検証する必要がよくあります。一般的な検証の 1 つは、データが指定された数値形式に準拠しているかどうかを確認することです。 PHP では、正規表現を使用してこの種の検証を行うことができます。この記事では、PHP 正規表現を使用して数値形式を検証する方法を紹介し、具体的なコード例を示します。まず、一般的な数値形式の検証要件を見てみましょう。整数: 0 ～ 9 の数字のみが含まれ、プラスまたはマイナス記号で始めることができ、小数点は含まれません。浮動小数点

正規表現を使用して Golang でメールアドレスを検証するにはどうすればよいですか? May 31, 2024 pm 01:04 PM

正規表現を使用して Golang で電子メールアドレスを検証するには、次の手順に従います。 regexp.MustCompile を使用して、有効な電子メールアドレス形式と一致する正規表現パターンを作成します。 MatchString 関数を使用して、文字列がパターンと一致するかどうかを確認します。このパターンは、次のようなほとんどの有効な電子メールアドレス形式をカバーします。ローカルユーザー名には文字、数字、および特殊文字を含めることができます: !.#$%&'*+/=?^_{|}~-` ドメイン名には少なくとも次の文字が含まれている必要があります。 1 文字の後に文字、数字、またはハイフンを続けます。トップレベルドメイン (TLD) は 63 文字を超えることはできません。

Go で正規表現を使用してタイムスタンプを照合するにはどうすればよいですか? Jun 02, 2024 am 09:00 AM

Go では、正規表現を使用してタイムスタンプを照合できます。ISO8601 タイムスタンプの照合に使用されるような正規表現文字列をコンパイルします。 ^\d{4}-\d{2}-\d{2}T \d{ 2}:\d{2}:\d{2}(\.\d+)?(Z|[+-][0-9]{2}:[0-9]{2})$ 。 regexp.MatchString 関数を使用して、文字列が正規表現と一致するかどうかを確認します。

Go言語の正規表現と文字列処理をマスターする Nov 30, 2023 am 09:54 AM

最新のプログラミング言語として、Go 言語は強力な正規表現と文字列処理関数を提供し、開発者が文字列データをより効率的に処理できるようにします。開発者にとって、Go 言語での正規表現と文字列処理を習得することは非常に重要です。この記事では、Go 言語の正規表現の基本概念と使い方、Go 言語を使用して文字列を処理する方法を詳しく紹介します。 1. 正規表現正規表現は文字列のパターンを記述するためのツールであり、文字列の照合、検索、置換などの操作を簡単に実装できます。

PHP 正規表現: 厳密な一致とあいまいな包含の除外 Feb 28, 2024 pm 01:03 PM

PHP 正規表現: 完全一致と除外ファジー包含正規表現は、プログラマがテキストを処理する際に効率的な検索、置換、フィルタリングを実行できる強力なテキストマッチングツールです。 PHP では、正規表現は文字列処理やデータマッチングにも広く使用されています。この記事では、PHP で完全一致を実行し、あいまい包含操作を除外する方法に焦点を当て、具体的なコード例を使用して説明します。完全一致完全一致とは、バリエーションや余分な単語ではなく、正確な条件を満たす文字列のみと一致することを意味します。

Goで正規表現を使用してパスワードを確認するにはどうすればよいですか? Jun 02, 2024 pm 07:31 PM

Go で正規表現を使用してパスワードを検証する方法は次のとおりです。パスワードの最小要件 (小文字、大文字、数字、特殊文字を含む少なくとも 8 文字) を満たす正規表現パターンを定義します。 regexp パッケージの MustCompile 関数を使用して正規表現パターンをコンパイルします。 MatchString メソッドを使用して、入力文字列が正規表現パターンと一致するかどうかをテストします。

正規表現のワイルドカードとは何ですか? Nov 17, 2023 pm 01:40 PM

正規表現のワイルドカードには、「.」、「*」、「+」、「?」、「^」、「$」、「[]」、「[^]」、「[a-z]」、「[A-Z]」が含まれます。、"[0-9]"、"\d"、"\D"、"\w"、"\W"、"\s&quo

Golangで正規表現を使用してURLを検出するにはどうすればよいですか? May 31, 2024 am 10:32 AM

正規表現を使用して Golang で URL を検出する手順は次のとおりです。 regexp.MustCompile(pattern) を使用して正規表現パターンをコンパイルします。パターンは、プロトコル、ホスト名、ポート (オプション)、パス (オプション)、およびクエリパラメーター (オプション) と一致する必要があります。 regexp.MatchString(pattern,url) を使用して、URL がパターンと一致するかどうかを検出します。

See all articles

中国語の文字を UTF-8 正規表現と照合する方法、utf-8 正規表現_PHP チュートリアル

UTF-8 正規表現が中国語の文字と一致する方法、utf-8 正規表現

ホットAIツール

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

人気の記事

ホットツール

メモ帳++7.3.1

SublimeText3 中国語版

ゼンドスタジオ 13.0.1

ドリームウィーバー CS6

SublimeText3 Mac版

ホットトピック