今回は正規表現u修飾子の使い方を詳しく解説します(コード付き) 正規表現u修飾子を使用する際の注意点について、実際のケースを見てみましょう。
正規表現 u 修飾子:
この修飾子は、uFFFF より大きい Unicode 文字を正しく処理する機能を識別します。
言い換えれば、4 バイトの UTF-16 エンコードは正しく処理されます。
この修飾子は ES2015 の新機能です。その他の新しい正規表現機能については、「ES2015 の正規表現の新機能」の章を参照してください。
その他の正規表現チュートリアルについては、正規表現チュートリアル セクションを参照してください。
コード例:
console.log(/^\uD842/u.test("\uD842\uDFB7"))
「uD842uDFB7」は文字を表す4バイトのUTF-16エンコーディングであるため、falseを出力します。そのため、正規表現にu修飾子があれば認識できます。
console.log(/^\uD842/.test("\uD842\uDFB7"))
出力 true; u 修飾子がないと、4 バイトの UTF-16 エンコーディングは 1 文字として認識されないため、一致が生成されます。
/^.$/.test("\uD842\uDFB7")//false /^.$/u.test("\uD842\uDFB7")//true
メタキャラクタードット(.)の使用法については、正規表現.ドットメタキャラクターの章を参照してください。
/^.$/.test("\uD842\uDFB7")//false /^.$/u.test("\uD842\uDFB7")//true
u 修飾子を追加すると、ドット メタキャラクターは 0xFFFF より大きいコード ポイントを持つ Unicode 文字と一致するようになります。
/ \u{61} /.test("a")//false / \u{61} / u.test("a")//true
u 修飾子を使用すると、正規表現は中括弧 {} で表される Unicode 文字を認識できます。それ以外の場合、{61} は 61 個の u 文字を表す 量指定子 としても解釈されます。
この記事の事例を読んだ後は、この方法を習得したと思います。さらに興味深い情報については、php 中国語 Web サイトの他の関連記事に注目してください。
推奨読書:
正規表現での W メタキャラクターの使用の詳細な説明 (コード付き)
正規表現での . メタキャラクターの使用の詳細な説明 (コード付き)
以上が正規表現での u 修飾子の使用の詳細な説明 (コード付き)の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。