ホームページ バックエンド開発 Python チュートリアル Python 正規表現の構文を例とともに詳しく説明します

Python 正規表現の構文を例とともに詳しく説明します

Aug 23, 2018 pm 05:47 PM

前の記事では、Python 正規表現の概要を説明しました。実際、正規表現は特殊な文字シーケンスであり、文字列がパターンに一致するかどうかを簡単にチェックするのに役立ちます。 Python にはバージョン 1.5 以降、Perl スタイルの正規表現パターンを提供する re モジュールが追加されました。 re モジュールは、Python 言語に完全な正規表現機能をもたらします。コンパイル関数は、パターン文字列とオプションのフラグ引数に基づいて正規表現オブジェクトを生成します。このオブジェクトには、正規表現の一致と置換のための一連のメソッドがあります。 re モジュールには、これらのメソッドとまったく同じ関数も用意されています。これらの関数は、パターン文字列を最初のパラメータとして使用します。この章では、Python でよく使用される 正規表現 処理関数を主に紹介します。

String はプログラミングにおいて最も複雑なデータ構造であり、string を操作する必要がある場所はほとんどどこでもあります。たとえば、文字列 が正当な電子メール アドレスであるかどうかを判断するには、program で @ の前後の部分文字列を抽出し、それが単語であるかドメインであるかを個別に判断することができます。しかし、これは面倒なだけでなく、コードの再利用が困難になります。

正規表現は、文字列を照合するために使用される強力な武器です。その設計思想は、記述言語を使用して文字列のルールを定義することです。ルールに準拠する文字列はすべて「一致」とみなされます。それ以外の場合、文字列は不正です。

したがって、文字列が正当な電子メールであるかどうかを判断する方法は次のとおりです:

1. 電子メールに一致する正規表現を作成します;

2. この正規表現を使用します。ユーザーの入力を照合して、それが合法かどうかを判断します。

正規表現は文字列でも表されるため、まず文字を使用して文字を記述する方法を理解する必要があります。

正規表現では、文字を直接指定すると完全一致となります。数値と一致させるには \d を使用し、文字または数字と一致させるには \w を使用します:

1. '00\d' は '007' と一致しますが、'00A' と一致することはできません;

2.'\d\d\d' は '010' に一致します;

3.'\w\w\d' は 'py3' に一致します;

. 任意の文字に一致します

5.'py.' は、'pyc'、'pyo'、'py!' などと一致します。

可変長文字を一致させるには、

正規表現式で、* を使用して任意の数の文字 (0 を含む) を表し、 を使用して少なくとも 1 つの文字を表し、? を使用して0 または 1 文字を表します。n 文字を表すには {n} を使用します。n-m 文字を表すには {n,m} を使用します。

複雑な例を見てみましょう: \d{3}\s \d{3 ,8} 。

左から右に解釈してみましょう:

1.\d{3} は、「010」などの 3 つの数字の一致を意味します;

2.\s OK 一致スペース (タブやその他の空白文字を含む)、つまり \s は ' '、' ' などの一致など、少なくとも 1 つのスペースを意味します;

3.\d{3,8} は 3- を意味します8 数値 (例: '1234567')。

まとめると、上記の正規表現は、任意の数のスペースで区切られた市外局番を持つ電話番号を照合できます。

「010-12345」のような番号を照合したい場合はどうすればよいですか? 「-」は特殊文字であるため、正規表現では「\」を使用してエスケープする必要があるため、上記の正規表現は \d{3}\-\d{3,8} となります。

ただし、「010 - 12345」はスペースがあるため依然として一致できません。したがって、より複雑なマッチング方法が必要になります。

Advanced

より正確に一致させるには、次のように [] を使用して範囲を表すことができます:

1 . [0-9a-zA-Z\_] は数字、文字、またはアンダースコアと一致します。

2.[0-9a-zA-Z\_] は少なくとも 1 つの数字、文字、またはアンダースコアと一致します。 「a100」、「0_Z」、「Py3000」などの文字列;

3.[a-zA-Z\_][0-9a-zA-Z\_]* と一致する可能性があります文字またはアンダースコアで始まり、Python で有効な変数である数字、文字、またはアンダースコアで構成される任意の数の文字列が続きます;

4.[a-zA-Z\_][0] -9a -zA-Z\_]{0, 19} は、変数の長さをより正確に 1 ~ 20 文字 (最初の文字の後は最大 19 文字) に制限します。

A|B は A または B と一致するため、(P|p)ython は「Python」または「python」と一致します。

##^ は行の先頭を意味し、^\d は数字で始まらなければならないことを意味します。

$ は行の終わりを示し、\d$ は数字で終わる必要があることを示します。

py は 'python' とも一致することに気づいたかもしれませんが、^py$ を追加すると行全体の一致になるため、'py' とのみ一致します。

モジュール

有了准备知识,我们就可以在Python中使用正则表达式了。Python提供re模块,包含所有正则表达式的功能。由于Python的字符串本身也用\转义,所以要特别注意:

s = 'ABC\\-001' # Python的字符串
# 对应的正则表达式字符串变成:
# 'ABC\-001'
ログイン後にコピー

因此我们强烈建议使用Python的r前缀,就不用考虑转义的问题了:

s = r'ABC\-001' # Python的字符串
# 对应的正则表达式字符串不变:
# 'ABC\-001'
ログイン後にコピー

先看看如何判断正则表达式是否匹配:

>>> import re
>>> re.match(r'^\d{3}\-\d{3,8}$', '010-12345')
<_sre.SRE_Match object; span=(0, 9), match=&#39;010-12345&#39;
>>>> re.match(r&#39;^\d{3}\-\d{3,8}$&#39;, &#39;010 12345&#39;)
>>>
ログイン後にコピー

match()方法判断是否匹配,如果匹配成功,返回一个Match对象,否则返回None。常见的判断方法就是:

test = &#39;用户输入的字符串&#39;
if re.match(r&#39;正则表达式&#39;, test):
    print(&#39;ok&#39;)
else:
    print(&#39;failed&#39;)
ログイン後にコピー


以上がPython 正規表現の構文を例とともに詳しく説明しますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

Video Face Swap

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

LinuxターミナルでPythonバージョンを表示するときに発生する権限の問題を解決する方法は? LinuxターミナルでPythonバージョンを表示するときに発生する権限の問題を解決する方法は? Apr 01, 2025 pm 05:09 PM

LinuxターミナルでPythonバージョンを表示する際の許可の問題の解決策PythonターミナルでPythonバージョンを表示しようとするとき、Pythonを入力してください...

プロジェクトの基本と問題駆動型の方法で10時間以内にコンピューター初心者プログラミングの基本を教える方法は? プロジェクトの基本と問題駆動型の方法で10時間以内にコンピューター初心者プログラミングの基本を教える方法は? Apr 02, 2025 am 07:18 AM

10時間以内にコンピューター初心者プログラミングの基本を教える方法は?コンピューター初心者にプログラミングの知識を教えるのに10時間しかない場合、何を教えることを選びますか...

中間の読書にどこでもfiddlerを使用するときにブラウザによって検出されないようにするにはどうすればよいですか? 中間の読書にどこでもfiddlerを使用するときにブラウザによって検出されないようにするにはどうすればよいですか? Apr 02, 2025 am 07:15 AM

fiddlereveryversings for the-middleの測定値を使用するときに検出されないようにする方法

あるデータフレームの列全体を、Python内の異なる構造を持つ別のデータフレームに効率的にコピーする方法は? あるデータフレームの列全体を、Python内の異なる構造を持つ別のデータフレームに効率的にコピーする方法は? Apr 01, 2025 pm 11:15 PM

PythonのPandasライブラリを使用する場合、異なる構造を持つ2つのデータフレーム間で列全体をコピーする方法は一般的な問題です。 2つのデータがあるとします...

uvicornは、serving_forever()なしでhttpリクエストをどのように継続的に聞いていますか? uvicornは、serving_forever()なしでhttpリクエストをどのように継続的に聞いていますか? Apr 01, 2025 pm 10:51 PM

UvicornはどのようにしてHTTPリクエストを継続的に聞きますか? Uvicornは、ASGIに基づく軽量のWebサーバーです。そのコア機能の1つは、HTTPリクエストを聞いて続行することです...

文字列を介してオブジェクトを動的に作成し、Pythonでメソッドを呼び出す方法は? 文字列を介してオブジェクトを動的に作成し、Pythonでメソッドを呼び出す方法は? Apr 01, 2025 pm 11:18 PM

Pythonでは、文字列を介してオブジェクトを動的に作成し、そのメソッドを呼び出す方法は?これは一般的なプログラミング要件です。特に構成または実行する必要がある場合は...

See all articles