Python の正規表現タイプには、特定の文字の一致、繰り返し文字、選択、グループ化と参照、事前定義されたパターン、境界条件、貪欲な一致と非貪欲な一致などが含まれます。詳細な紹介: 1. 特定の文字に一致: .: 任意の文字 (改行を除く) に一致; ^: 入力文字列の先頭に一致; $: 入力文字列の末尾に一致; \d: [0 に相当する任意の数値に一致- 9]; \D: [^0-9] に相当する任意の非数字文字と一致します; \s: 任意の空白文字 (スペース、タブ、フォーム フィードなどを含む) などと一致します。
このチュートリアルのオペレーティング システム: Windows 10 システム、Dell G3 コンピューター。
Python の正規表現 (正規表現) は、複雑な文字列パターンの照合、検索、置換、分割を行うことができる強力なテキスト処理ツールです。一般的な Python 正規表現をいくつか示します。
-
特定の文字に一致します。
- .: 任意の文字 (改行を除く) に一致します。
#^: 入力文字列の先頭と一致します。 - $: 入力文字列の末尾と一致します。
- \d: [0-9] に相当する任意の数値と一致します。
- \D: [^0-9] と同等の数値以外の文字と一致します。
- \s: 任意の空白文字 (スペース、タブ、フォーム フィードなどを含む) と一致します。
- \S: 空白以外の任意の文字と一致します。
- \w: [a-zA-Z0-9_] に相当する、任意の文字、数字、またはアンダースコアと一致します。
- \W: [^a-zA-Z0-9_] に相当する、文字、数字、アンダースコア以外の文字と一致します。
-
- 繰り返し文字:
*: 前の部分式と 0 回以上一致します。 - : 前の部分式と 1 回以上一致します。
- ?: 前の部分式と 0 回または 1 回一致します。
- {n}: n は負ではない整数です。特定の回数 n 回一致します。
- {n,}: n は負ではない整数です。少なくとも n 回一致します。
- {n,m}: m と n はどちらも負ではない整数です。少なくとも n 回、最大で m 回一致します。
-
- 選択、グループ化、および引用:
|: または、たとえば、a|b が 'a' または 'b' に一致することを示します。 - ( ): 複数の項目を 1 つの単位に結合します。たとえば、(abc) と abc は同じ内容に一致します。キャプチャされたコンテンツは、\1、\2、\3... などで参照できます。
- \: \() などの特殊文字をエスケープして、グループ化文字としてではなく実際の "(" 文字と一致させます。
-
- 事前定義されたパターン :
\d または \D: 1 つ以上の数字または数字以外の文字と一致します。 - \s または \S: 1 つ以上の空白文字または空白文字以外の文字と一致します。
- .: re モジュールでは、. は特殊文字とみなされているため直接使用できません。任意の文字 (改行を含む) と一致させたい場合は、[\s\S] や [ などを使用できます。 ^ \s] モード。
-
- 境界条件:
^: 角括弧の外側の否定を示し、文字列の始まりを示すこともできます。負でない整数は角括弧内で表されます。たとえば、[0-9]^ は 0 で始まる数字の文字列を表します。- $: 文字列の終わりを表し、ドル記号も表すことができます. 角括弧内 負の整数を表します。たとえば、[-1]^ は -1 で終わる数値の文字列を表します。
-
- 貪欲なマッチングと非貪欲なマッチング:
デフォルトでは、正規表現は貪欲です。つまり、(他の要件が満たされる限り) 可能な限り一致します。 ? を使用すると、正規表現を非貪欲にする (可能な限り少数の一致を一致させる) ことができます。たとえば、「a」で始まるすべての単語を検索する場合、「a*」は可能な限り多くの「a」文字と一致し、「a*?」は条件を満たす最小限の「a」文字のみと一致します。
以上がPythonの正規表現とは何ですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。