JavaScript RegExp を使用してフィンランド語テキスト内の単語の境界を Unicode 文字と一致させる方法

Mary-Kate Olsen
リリース: 2024-10-31 06:14:02
オリジナル
432 人が閲覧しました

How to Match Word Boundaries with Unicode Characters in Finnish Text Using JavaScript RegExp?

JavaScript RegExp Word Boundaries Unicode 文字

質問:

文字列に JavaScript の RegExp を使用する場合フィンランド語のテキストで ä、ö、å などの特殊文字を使用する場合、単語境界 b はこれらの文字で始まる単語と一致しません。 Unicode 文字の適切なマッチングを可能にするために、この問題をどのように解決できますか?

回答:

b ワード境界メタキャラクターは、先頭で Unicode 文字をマッチングする際に制限に直面する可能性があります。文字列。これに対処するには:

Replace \b with (?:^|\s)
ログイン後にコピー

内訳:

  • (?: ... ) は非キャプチャ グループを作成します。
  • ^ は文字列の先頭に一致します。
  • |s は空白に一致します。
  • (?:^|s) は、事実上、entweder am Anfang der Zeichenfolge oder nach einem Leerzeichen に一致することを指定します。

例:

次のコードは、b の代わりに非キャプチャ グループを使用してフィンランド語の単語と Unicode 文字を一致させる方法を示しています。

<code class="js">var title = "this is simple string with finnish word tämä on ääkköstesti älkää ihmetelkö";
var searchterm = "äl";

if (new RegExp("(?:^|\s)" + searchterm, "gi").test(title)) {
    console.log("Match:", searchterm, title);
} else {
    console.log("Nothing found:", searchterm);
}</code>
ログイン後にコピー

このアプローチ文字列の先頭または空白のいずれかを単語の境界と見なすため、Unicode 文字列「ääkköstesti」の検索語「äl」と正常に一致します。

以上がJavaScript RegExp を使用してフィンランド語テキスト内の単語の境界を Unicode 文字と一致させる方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
著者別の最新記事
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート
私たちについて 免責事項 Sitemap
PHP中国語ウェブサイト:福祉オンライン PHP トレーニング,PHP 学習者の迅速な成長を支援します!