Python で正規表現を使用する方法
Python は、人気のあるプログラミング言語として、文字列データの処理と操作のための正規表現の使用をサポートしています。正規表現は、文字列の特性を記述する方法であり、文字列内の内容の照合、フィルタリング、および置換に使用できます。 Python では、re モジュールが提供する関数ライブラリを使用して正規表現を操作および処理します。
1. 正規表現の基本
正規表現では、文字列内の特定のパターンに一致するためにいくつかの特殊文字が使用されます。最も単純な正規表現は、a、b、c などの通常の文字です。これらの文字は、それ自体とのみ一致します。さらに、正規表現は次の特殊文字もサポートしています:
- . 任意の 1 文字と一致することを意味します
- w は任意の 1 文字、数字、またはアンダースコア文字と一致することを意味します
- d は任意の 1 つの数字と一致することを意味します
- s は任意の 1 つのスペース、タブ、または改行文字と一致することを意味します
- は 0 個以上の先行文字と一致することを意味します
- は、先行する 1 つ以上の文字と一致することを意味します
- ? は、先行する文字の 0 つまたは 1 つと一致することを意味します 文字
- [ ] は文字セットの定義を表します
- | OR 演算子を表します
- () グループ化を表します
次のコードは、文字セットのみに一致する最も単純な正規表現を示しています。文字列内の文字 a:
import re text = "Hello world" pattern = 'a' match = re.findall(pattern, text) print(match)
文字列には文字 a がないため、空のリストのみが出力されることがわかります。ここで、正規表現を使用して単語を一致させる方法を見てみましょう。
import re text = "Hello world" pattern = r"w+" match = re.findall(pattern, text) print(match)
これで、2 つの単語を含むリストができました。この正規表現では、
は単語の境界を表し、w
は 1 つ以上の単語文字で構成される一致する単語を表します。
2. re モジュールを使用して照合する
Python では、re モジュールを使用して、次のようなさまざまな文字列照合操作を実行できます。 ##re .search(pattern, string[, flags])
: 最初の位置に一致するパターンを検索し、一致するオブジェクトを返します。re.match(pattern, string[, flags])
: 文字列の先頭からパターンを照合し、照合が成功した場合は照合オブジェクトを返します。re.findall(pattern, string[, flags])
: パターンに一致するすべての部分文字列を検索し、リストとして返します。re.finditer(pattern, string[, flags])
: パターンに一致するすべての部分文字列を検索し、その反復子を返します。re.sub(pattern, repl, string[, count, flags])
: 文字列内のパターンに一致するすべての部分文字列を repl に置き換えます。re.split(pattern, string[, maxsplit, flags])
: 正規表現パターンに従って文字列を分割し、結果をリストとして返します。次のコードは、re モジュールで
search() 関数と
関数を使用して正規表現と一致させる方法を示しています。 上記のコードでは、まず
search() 関数を使用して、文字列内の最初の一致を検索します。見つかった場合は
MatchObject
findall() 関数も使用しました。
3. グループ化
正規表現では、括弧
()
group()
またはgroups() 関数を使用して、グループ化された部分式にアクセスできます。
次のコードは、グループ化を使用して IP アドレスを照合する方法を示しています。
import re text = "The quick brown fox jumps over the lazy dog." pattern = r"w{3}" match = re.search(pattern, text) if match: print("Found match:", match.group(0)) else: print("No match found") matches = re.findall(pattern, text) print("Found matches:", matches)
使用する正規表現
(d{1,3}).(d{1,3 } ).(d{1,3}).(d{1,3}) IP アドレスを 4 つの部分に分割します。次に、group()
関数を使用して各セクションにアクセスします。4. re.sub() 関数を使用して置換します
re.sub()
import re ip_address = "192.168.1.1" pattern = r"(d{1,3}).(d{1,3}).(d{1,3}).(d{1,3})" match = re.search(pattern, ip_address) print("IP address:", match.group(0)) print("First octet:", match.group(1)) print("Second octet:", match.group(2)) print("Third octet:", match.group(3)) print("Fourth octet:", match.group(4))
re.sub() 関数を使用して次のことを行います。 replace a string with 単語「fox」を「cat」に置換し、置換された文字列を出力します。指定された置換の数を制御したい場合は、オプションの count パラメータを re.sub() 関数に追加するだけです。
Python の正規表現は非常に強力で、さまざまな複雑な文字列パターンに一致します。 re モジュールの関数を使用して、正規表現に関連する操作を完了できます。正規表現は、文字列を処理する場合に非常に便利なツールです。
以上がPython で正規表現を使用する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

Video Face Swap
完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック









PHP 正規表現の検証: 数値形式の検出 PHP プログラムを作成する場合、ユーザーが入力したデータを検証する必要がよくあります。一般的な検証の 1 つは、データが指定された数値形式に準拠しているかどうかを確認することです。 PHP では、正規表現を使用してこの種の検証を行うことができます。この記事では、PHP 正規表現を使用して数値形式を検証する方法を紹介し、具体的なコード例を示します。まず、一般的な数値形式の検証要件を見てみましょう。 整数: 0 ~ 9 の数字のみが含まれ、プラスまたはマイナス記号で始めることができ、小数点は含まれません。浮動小数点

正規表現を使用して Golang で電子メール アドレスを検証するには、次の手順に従います。 regexp.MustCompile を使用して、有効な電子メール アドレス形式と一致する正規表現パターンを作成します。 MatchString 関数を使用して、文字列がパターンと一致するかどうかを確認します。このパターンは、次のようなほとんどの有効な電子メール アドレス形式をカバーします。 ローカル ユーザー名には文字、数字、および特殊文字を含めることができます: !.#$%&'*+/=?^_{|}~-` ドメイン名には少なくとも次の文字が含まれている必要があります。 1 文字の後に文字、数字、またはハイフンを続けます。トップレベル ドメイン (TLD) は 63 文字を超えることはできません。

Go では、正規表現を使用してタイムスタンプを照合できます。ISO8601 タイムスタンプの照合に使用されるような正規表現文字列をコンパイルします。 ^\d{4}-\d{2}-\d{2}T \d{ 2}:\d{2}:\d{2}(\.\d+)?(Z|[+-][0-9]{2}:[0-9]{2})$ 。 regexp.MatchString 関数を使用して、文字列が正規表現と一致するかどうかを確認します。

最新のプログラミング言語として、Go 言語は強力な正規表現と文字列処理関数を提供し、開発者が文字列データをより効率的に処理できるようにします。開発者にとって、Go 言語での正規表現と文字列処理を習得することは非常に重要です。この記事では、Go 言語の正規表現の基本概念と使い方、Go 言語を使用して文字列を処理する方法を詳しく紹介します。 1. 正規表現 正規表現は文字列のパターンを記述するためのツールであり、文字列の照合、検索、置換などの操作を簡単に実装できます。

PHP 正規表現: 完全一致と除外 ファジー包含正規表現は、プログラマがテキストを処理する際に効率的な検索、置換、フィルタリングを実行できる強力なテキスト マッチング ツールです。 PHP では、正規表現は文字列処理やデータ マッチングにも広く使用されています。この記事では、PHP で完全一致を実行し、あいまい包含操作を除外する方法に焦点を当て、具体的なコード例を使用して説明します。完全一致 完全一致とは、バリエーションや余分な単語ではなく、正確な条件を満たす文字列のみと一致することを意味します。

Go で正規表現を使用してパスワードを検証する方法は次のとおりです。 パスワードの最小要件 (小文字、大文字、数字、特殊文字を含む少なくとも 8 文字) を満たす正規表現パターンを定義します。 regexp パッケージの MustCompile 関数を使用して正規表現パターンをコンパイルします。 MatchString メソッドを使用して、入力文字列が正規表現パターンと一致するかどうかをテストします。

PHP は広く使用されているプログラミング言語であり、特に Web 開発の分野で人気があります。 Web開発の過程では、ユーザーが入力したテキストをフィルタリングして検証する必要がよくありますが、その中でも文字フィルタリングは非常に重要な操作です。この記事では、PHP で正規表現を使用して漢字フィルタリングを実装する方法と、具体的なコード例を紹介します。まず最初に、Unicode の漢字の範囲は u4e00 から u9fa5 までである、つまりすべての漢字がこの範囲内にあることを明確にする必要があります。

正規表現のワイルドカードには、「.」、「*」、「+」、「?」、「^」、「$」、「[]」、「[^]」、「[a-z]」、「[A-Z]」が含まれます。 、"[0-9]"、"\d"、"\D"、"\w"、"\W"、"\s&quo
