非 ASCII 文字を JavaScript Regex の単語境界と一致させるにはどうすればよいですか?

Barbara Streisand
リリース: 2024-10-27 04:46:29
オリジナル
551 人が閲覧しました

How to Match Non-ASCII Characters with Word Boundaries in JavaScript Regex?

JavaScript 正規表現内の非 ASCII 文字と単語境界の一致

JavaScript では、単語境界 (b) 一致を持つ RegExp オブジェクトが発生する可能性があります。フィンランド語の母音 (ä、ö、および å) などの非 ASCII 文字を処理する場合の制限。これらの文字を正確に一致させるには、アプローチを調整する必要があります。

次のコードを考えてみましょう:

<code class="javascript">var title = "this is simple string with finnish word tämä on ääkköstesti älkää ihmetelkö";
var searchterm = "äl";

if (new RegExp("\b" + searchterm, "gi").test(title)) {
  // This does not work for "äl"
}</code>
ログイン後にコピー

このコードは、b 境界を使用してタイトル内の用語「äl」と一致しようとします。 。ただし、 b は非 ASCII 文字を除き、標準の 256 バイト範囲に基づいて単語境界と一致するため、失敗します。

解決策: 単語境界を持つ非キャプチャ グループ

この問題を解決するには、 b を、文字列の先頭または空白文字のいずれかに明示的に一致する非キャプチャ グループに置き換えます:

<code class="javascript">if (new RegExp("(?:^|\s)" + searchterm, "gi").test(title)) {
  // Now it works for "äl"
}</code>
ログイン後にコピー

内訳:

  • (?:...): 非キャプチャグループ
  • ^: 文字列の先頭
  • s: 空白
  • |: "or" 演算子

この変更されたコードは、非 ASCII 文字を含むより柔軟な語頭境界条件を定義しているため、タイトルの用語「äl」と一致します。

以上が非 ASCII 文字を JavaScript Regex の単語境界と一致させるにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
著者別の最新記事
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート
私たちについて 免責事項 Sitemap
PHP中国語ウェブサイト:福祉オンライン PHP トレーニング,PHP 学習者の迅速な成長を支援します!