JavaScript/jQuery の正規表現との非 ASCII 文字のマッチング
正規表現内の非 ASCII 文字のマッチングは、処理に不可欠な場合があります英語以外の文字を含む可能性のある国際化された文字列またはデータ。 JavaScript/jQuery では、次のアプローチを使用できます。
ASCII の除外:
最も簡単なアプローチは、文字クラスの否定を使用して ASCII 文字を一致から除外することです。構文:
[^\x00-\x7F]+
この正規表現は、範囲内にない 1 つ以上の文字と一致します。 ASCII 文字の範囲 (0 ~ 127)。
Unicode の除外:
同様に、Unicode 文字を除外できます:
[^\u0000-\u007F]+
この正規表現は除外します0x0000 から 0x0000 までの範囲のすべての Unicode 文字0x007F.
Unicode ブロック マッチング:
より詳細に制御するために、Unicode 文字ブロックを使用して一致をフィルターできます。これらのブロックは、キリル文字やハングルなど、関連する文字のグループを表します。
[UTF-8 Regex Checker](https://rishida.net/tools/regex/) などのツールを使用して Unicode ブロックを見つけます一致する必要がある文字の数。たとえば、キリル文字を照合するには:
[\p{Cyrillic}]+
個々の単語の処理:
非 ASCII 文字を含む可能性のある個々の単語を照合するには、次の手法を組み合わせることができます。単語境界アンカー付き:
\b[^\x00-\x7F]+\b
この正規表現は、ASCII で囲まれていない単語に一致します。文字。
以上がJavaScript/jQuery 正規表現を使用して非 ASCII 文字を照合するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。