[転送] UTF-8 漢字正規表現、utf-8 漢字正規表現_PHP チュートリアル
【移転】UTF-8漢字正規表現、utf-8漢字正規表現
元リンク:http://blog.csdn.net/wide288/article/details/30066639
$str = "プログラミング";
// if(!preg_match("/^[x{4e00}-x{9fa5}A-Za-z0-9_]+$/u",$str)) //UTF -8 漢字英数字下線正規表現
if(!preg_match("/^[x{4e00}-x{9fa5}]+$/u",$str)) //UTF-8 漢字英数字下線正規表現 計算式
。
}
-------------------------------------
UTF-8 マッチング:
php では、x は 16 進数のデータを表すために使用されます。したがって、次のコードに変換されます: $str = "php programming"; if (preg_match("/^[x4e00-x9fa5]+$/",$str)) { print("この文字列はすべて中国語です" ); } else { print("文字列の一部が中国語ではありません"); どうやら $str を "programming" という単語に置き換えると、エラーは報告されなくなったようです。 、結果はまだ「文字列のすべてが中国語ではありません。中国語です。」と表示されますが、この判断はまだ十分正確ではないようです。
重要: 「正規表現に精通している」をチェックした後、[x4e00-x9fa5] については自分で説明を強化したことがわかりましたPHP の正規表現では、[x4e00-x9fa5] は実際には文字と文字グループの組み合わせです。 , x{hex} は 16 進数を表します。hex は 1 ~ 2 桁または 4 桁にすることができますが、4 桁の場合は波括弧を追加する必要があります。 x{FF} より大きい 16 進数。u 修飾子と一緒に使用する必要があります。そうでないと、不正なエラーが発生します
。インターネット上では、全角文字を一致させるための規則が見つかりません: ^[x80-xff]*^。 / 、ここで中括弧を追加する必要はありません [u4e00 -u9fa5] は中国語と一致しますが、PHP はそれをサポートしていません。ただし、x で表される 16 進数データが、で提供される x4e00 ~ x9fa5 の範囲と異なるのはなぜですか。 js?そこで、以下のコードに変更したところ、それが非常に正確であることがわかりました。 $str = "php programming" if (preg_match("/^[x{4e00}-x{9fa5}]+$/u",$str ) ) { print("この文字列はすべて中国語です"); } else { print("この文字列はすべて中国語ではありません") }
PHP で UTF-8 エンコードで正規表現を使用した場合の最終結果はわかります。正しい表現 - /^[x{4e00}-x{9fa5}]+$/u。上記の記事を参照して、次のテスト コードを作成します (次のコードをコピーし、.php ファイルとして保存します)
php $action = trim($_GET['action']); if($action == "sub") { $str = $_POST['dir']; //if(!preg_match("/^[". chr(0xa1) ."-".chr(0xff)."A-Za-z0-9_]+$/",$str)) //GB2312 中国語英数字下線正規表現 if(!preg_match("/^[x {4e00} -x {9fa5} a-za-z0-9 _]+$/u "、$ str) ;/font & gt; ";} Else {echo" & lt; font color = green & gt; を入力します。 value=""
GBK:
preg_match("/^[".chr(0xa1)."-".chr( 0xff)."A-Za-z0-9_]+$/ ",$str); //GB2312 漢字英数字下線正規表現
http://www.bkjia.com/PHPjc/1042014.html
www.bkjia.com

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック











PHP 正規表現の検証: 数値形式の検出 PHP プログラムを作成する場合、ユーザーが入力したデータを検証する必要がよくあります。一般的な検証の 1 つは、データが指定された数値形式に準拠しているかどうかを確認することです。 PHP では、正規表現を使用してこの種の検証を行うことができます。この記事では、PHP 正規表現を使用して数値形式を検証する方法を紹介し、具体的なコード例を示します。まず、一般的な数値形式の検証要件を見てみましょう。 整数: 0 ~ 9 の数字のみが含まれ、プラスまたはマイナス記号で始めることができ、小数点は含まれません。浮動小数点

PHP 正規表現: 完全一致と除外 ファジー包含正規表現は、プログラマがテキストを処理する際に効率的な検索、置換、フィルタリングを実行できる強力なテキスト マッチング ツールです。 PHP では、正規表現は文字列処理やデータ マッチングにも広く使用されています。この記事では、PHP で完全一致を実行し、あいまい包含操作を除外する方法に焦点を当て、具体的なコード例を使用して説明します。完全一致 完全一致とは、バリエーションや余分な単語ではなく、正確な条件を満たす文字列のみと一致することを意味します。

正規表現を使用して Golang で電子メール アドレスを検証するには、次の手順に従います。 regexp.MustCompile を使用して、有効な電子メール アドレス形式と一致する正規表現パターンを作成します。 MatchString 関数を使用して、文字列がパターンと一致するかどうかを確認します。このパターンは、次のようなほとんどの有効な電子メール アドレス形式をカバーします。 ローカル ユーザー名には文字、数字、および特殊文字を含めることができます: !.#$%&'*+/=?^_{|}~-` ドメイン名には少なくとも次の文字が含まれている必要があります。 1 文字の後に文字、数字、またはハイフンを続けます。トップレベル ドメイン (TLD) は 63 文字を超えることはできません。

最新のプログラミング言語として、Go 言語は強力な正規表現と文字列処理関数を提供し、開発者が文字列データをより効率的に処理できるようにします。開発者にとって、Go 言語での正規表現と文字列処理を習得することは非常に重要です。この記事では、Go 言語の正規表現の基本概念と使い方、Go 言語を使用して文字列を処理する方法を詳しく紹介します。 1. 正規表現 正規表現は文字列のパターンを記述するためのツールであり、文字列の照合、検索、置換などの操作を簡単に実装できます。

Go では、正規表現を使用してタイムスタンプを照合できます。ISO8601 タイムスタンプの照合に使用されるような正規表現文字列をコンパイルします。 ^\d{4}-\d{2}-\d{2}T \d{ 2}:\d{2}:\d{2}(\.\d+)?(Z|[+-][0-9]{2}:[0-9]{2})$ 。 regexp.MatchString 関数を使用して、文字列が正規表現と一致するかどうかを確認します。

Go で正規表現を使用してパスワードを検証する方法は次のとおりです。 パスワードの最小要件 (小文字、大文字、数字、特殊文字を含む少なくとも 8 文字) を満たす正規表現パターンを定義します。 regexp パッケージの MustCompile 関数を使用して正規表現パターンをコンパイルします。 MatchString メソッドを使用して、入力文字列が正規表現パターンと一致するかどうかをテストします。

正規表現を使用して Golang で URL を検出する手順は次のとおりです。 regexp.MustCompile(pattern) を使用して正規表現パターンをコンパイルします。パターンは、プロトコル、ホスト名、ポート (オプション)、パス (オプション)、およびクエリ パラメーター (オプション) と一致する必要があります。 regexp.MatchString(pattern,url) を使用して、URL がパターンと一致するかどうかを検出します。

正規表現のワイルドカードには、「.」、「*」、「+」、「?」、「^」、「$」、「[]」、「[^]」、「[a-z]」、「[A-Z]」が含まれます。 、"[0-9]"、"\d"、"\D"、"\w"、"\W"、"\s&quo
