Python の `\b` 単語境界が正規表現内の特殊文字で失敗するのはなぜですか?
特殊文字を含むパターンの単語境界の処理
Python の re モジュールは、単語境界を照合するための b パターンを提供します。ただし、{} などの特殊文字を含むパターンと一緒に使用すると、予期しない動作になる可能性があります。
パターン Sortesindex[persons]{Sortes} について考えてみましょう。 b を使用して単語全体のインスタンスのみと一致することを確認すると、「test Sortesindex[persons]{Sortes} text」で肯定的な結果が得られると予想されますが、失敗します。
単語境界の動作の検査
ドキュメントでは、b を単語と単語以外の文字の間、または文字列の先頭/末尾と単語の間の境界を一致させると説明しています。 Character.
このパターンでは、 b は単語の末尾に一致しますが、明示的には先頭には一致しません。特殊文字として } が存在すると b に曖昧さが生じ、予期しない動作が発生します。
適応型単語境界の使用
1 つの解決策は、適応型単語境界を使用することです。パターンの周囲のコンテキストを考慮します。どちらかの側の非単語文字またはどちらかの側の単語文字をチェックして、正確な一致を保証します。これは次のように表すことができます:
(?:(?!w)|b(?=w)){}(?:(?<=w)b|(?
ここで:
- (?:(?!w)|b(?=w)) は左側の境界であり、一致が可能です。
- (?:(?<=w)b|(?
これにより、テスト文字列内の Sortesindex[persons]{Sortes} との正確な一致が保証されます。ただし、次のような一致は除外されます。ソート。
代替オプション
- 明確な単語境界: 適応型単語境界に似ていますが、単語文字が存在しないことが必要です。パターンの両側に。
- 空白境界: パターンが空白文字で囲まれている一致を特にチェックします。
正しいアプローチの選択
適応型単語境界はより緩やかです。パターンの周囲の非単語文字とのマッチングを可能にします。明確な単語境界はより制限的であり、両端に単語文字は必要ありません。特定のマッチング要件に最も適したアプローチを選択してください。
以上がPython の `\b` 単語境界が正規表現内の特殊文字で失敗するのはなぜですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

Video Face Swap
完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック











LinuxターミナルでPythonバージョンを表示する際の許可の問題の解決策PythonターミナルでPythonバージョンを表示しようとするとき、Pythonを入力してください...

fiddlereveryversings for the-middleの測定値を使用するときに検出されないようにする方法

PythonのPandasライブラリを使用する場合、異なる構造を持つ2つのデータフレーム間で列全体をコピーする方法は一般的な問題です。 2つのデータがあるとします...

10時間以内にコンピューター初心者プログラミングの基本を教える方法は?コンピューター初心者にプログラミングの知識を教えるのに10時間しかない場合、何を教えることを選びますか...

UvicornはどのようにしてHTTPリクエストを継続的に聞きますか? Uvicornは、ASGIに基づく軽量のWebサーバーです。そのコア機能の1つは、HTTPリクエストを聞いて続行することです...

Investing.comの反クラウリング戦略を理解する多くの人々は、Investing.com(https://cn.investing.com/news/latest-news)からのニュースデータをクロールしようとします。
