Heim > Backend-Entwicklung > Python-Tutorial > Detaillierte Erklärung regulärer Ausdrücke in Python

Detaillierte Erklärung regulärer Ausdrücke in Python

小云云
Freigeben: 2017-12-18 15:05:40
Original
2060 Leute haben es durchsucht


Reguläre Ausdrücke werden verwendet, um eine Reihe von Zeichenfolgen präzise auszudrücken. Dieser Artikel vermittelt Ihnen hauptsächlich die detaillierten Kenntnisse über reguläre Ausdrücke in Python und hofft, allen zu helfen.

| Hinweis, nur der |.-Operatorverwendet werden >
Operator Beschreibung Instanz
. Stellt ein beliebiges einzelnes Zeichen dar
操作符 说明 实例
. 表示任何单个字符
[ ] 字符集,单个字符取值范围 [abc]表示a或b或c; [a-z]表示a到z单个字符
[^ ] 非字符集,单个字符排除范围 [^abc]表示非a或非b或非c
* 前一个字符的0次或无限次扩展 abc*表示ab、abc、abcc、abccc...
+ 前一个字符的1次或无限次扩展 abc+表示abc、abcc、abccc...
? 前一个字符的0次或1次扩展 abc?表示ab、abc
| 左右表示任意一个 abc|def 表示abc或def
{m} 前一个字符的m次扩展 ab{2}表示abcc
{m,n} 前一个字符的m至n次扩展(含n) ab{1,2}表示abc、abcc
^ 匹配字符串开头 ^abc表示abc且在一个字符串的开头
$ 匹配字符串结尾 abc$表示abc且在一个字符串的结尾
( ) 分组标记,内部只能使用|操作符 (abc|def)表示abc或def
d 数字,等价于[0-9]
w 单词字符,等价于[A-Za-z0-9_]
[ ] Zeichensatz, Einzelzeichen-Wertebereich [abc] bedeutet a oder b oder c; [a-z] bedeutet ein einzelnes Zeichen von a bis z
[^ ] Nicht-Zeichensatz, Ausschlussbereich für einzelne Zeichen [^abc] bedeutet nicht a oder nicht b oder nicht c
* 0 oder unendliche Erweiterungen des vorherigen Zeichens abc* code> bedeutet <code>ab, abc, abcc, abccc...
+ 1 Mal oder unendlich des vorherigen Zeichens Untererweiterung abc+ bedeutet abc, abcc, abccc...
? td> 0 oder 1 Erweiterung des vorherigen Zeichens abc? bedeutet ab, abc
Links und rechts bedeutet irgendein abc|def bedeutet abc oder def
{m} M-fache Erweiterung des vorherigen Zeichens ab{2} bedeutet abcc
{m,n} M bis n Erweiterungen des vorherigen Zeichens (einschließlich n) ab{1,2} bedeutet, dass abc, abcc
^ mit dem Anfang der Zeichenfolge übereinstimmt ^abc bedeutet abc und steht am Anfang einer Zeichenfolge.
$ entspricht dem string End abc$ bedeutet abc und wird am Ende einer Zeichenfolge gruppiert
( ) (abc|def) kann intern zur Darstellung von abc oder def
d Zahl, entspricht [0-9]

w Wortzeichen, entspricht [A-Za-z0-9_]

Wenn Sie mit den oben genannten Operatoren vertraut sind, ist das folgende Beispiel nicht schwierig.

1. Es können nur Zahlen eingegeben werden: ^[0-9]*$

2. Es können nur n-stellige Zahlen eingegeben werden: ^d{n}$

3 .Es können nur Zahlen mit mindestens n Ziffern eingegeben werden: ^d{n,}$

4. Es können nur Zahlen mit m~n Ziffern eingegeben werden: ^d{m,n}$

5 .Es können nur Zahlen eingegeben werden, die mit Null und ungleich Null beginnen: ^(0|[1-9][0-9]*)$

6 Nur positive reelle Zahlen mit zwei Dezimalstellen können eingegeben werden: ^[ 0-9]+(.[0-9]{2})?$

7 Es können nur positive reelle Zahlen mit 1 bis 3 Dezimalstellen eingegeben werden: ^[ 0-9]+(.[0 -9]{1,3})?$


8 Es können nur positive Ganzzahlen ungleich Null eingegeben werden: ^+?[1-9][0-9 ]*$

函数 说明
re.match() 从字符串的起始位置匹配一个模式,如果起始位置匹配不成功的话,match()就返回none。
re.search() 扫描整个字符串并返回第一个成功的匹配。
re.sub() 用于替换字符串中的所有匹配正则表达式的子串,返回替换后的字符串
re.findall() 搜索字符串,以列表形式返回全部能匹配的子串
re.split() 将字符串按照正则表达式匹配结果进行切割,返回列表
re.finditer() 搜索字符串,返回一个匹配结果的迭代类型,每个迭代元素是match对象
【Regulärer Python3-Ausdruck】
>>> match= re.findall(r&#39;[1-9]\d{5}&#39;,&#39;100081BIT  BIT10008676&#39;)>>> print(match)
[&#39;100081&#39;, &#39;100086&#39;]>>> match = re.split(r&#39;[1-9]\d{5}&#39;,&#39;100081BIT  BIT10008676&#39;)>>> match
[&#39;&#39;, &#39;BIT  BIT&#39;, &#39;76&#39;]>>> match = re.split(r&#39;[1-9]\d{5}&#39;,&#39;100081BIT  BIT10008676&#39;,maxsplit=1)>>> match
[&#39;&#39;, &#39;BIT  BIT10008676&#39;]

>>>for m in re.finditer(r&#39;[1-9]\d{5}&#39;,&#39;100081BIT  BIT10008676&#39;):       if m:
            print(m.group(0))    
100081100086
Nach dem Login kopieren
Nach dem Login kopieren

Der Unterschied zwischen re.match und re.search

re.match stimmt nur mit dem Anfang der Zeichenfolge überein. Wenn der Anfang der Zeichenfolge nicht mit dem regulären Ausdruck übereinstimmt, schlägt die Übereinstimmung fehl Die Funktion gibt None zurück und re.search gleicht die gesamte Zeichenfolge ab, bis eine Übereinstimmung gefunden wird.


Detaillierte Erklärung regulärer Ausdrücke in Python

操作符说明实例
.表示任何单个字符
[ ]字符集,单个字符取值范围[abc]表示a或b或c; [a-z]表示a到z单个字符
[^ ]非字符集,单个字符排除范围[^abc]表示非a或非b或非c
*前一个字符的0次或无限次扩展abc*表示ab、abc、abcc、abccc...
+前一个字符的1次或无限次扩展abc+表示abc、abcc、abccc...
?前一个字符的0次或1次扩展abc?表示ab、abc
|左右表示任意一个abc|def 表示abc或def
{m}前一个字符的m次扩展ab{2}表示abcc
{m,n}前一个字符的m至n次扩展(含n)ab{1,2}表示abc、abcc
^匹配字符串开头^abc表示abc且在一个字符串的开头
$匹配字符串结尾abc$表示abc且在一个字符串的结尾
( )分组标记,内部只能使用|操作符(abc|def)表示abc或def
d数字,等价于[0-9]
w单词字符,等价于[A-Za-z0-9_]

Wenn Sie mit den oben genannten Operatoren vertraut sind, ist das folgende Beispiel nicht schwierig.

1. Es können nur Zahlen eingegeben werden: ^[0-9]*$

2. Es können nur n-stellige Zahlen eingegeben werden: ^d{n}$

3 .Es können nur Zahlen mit mindestens n Ziffern eingegeben werden: ^d{n,}$

4. Es können nur Zahlen mit m~n Ziffern eingegeben werden: ^d{m,n}$

5 .Es können nur Zahlen eingegeben werden, die mit Null und ungleich Null beginnen: ^(0|[1-9][0-9]*)$

6 Nur positive reelle Zahlen mit zwei Dezimalstellen können eingegeben werden: ^[ 0-9]+(.[0-9]{2})?$

7 Es können nur positive reelle Zahlen mit 1 bis 3 Dezimalstellen eingegeben werden: ^[ 0-9]+(.[0 -9]{1,3})?$

8 Es können nur positive Ganzzahlen ungleich Null eingegeben werden: ^+?[1-9][0-9 ]*$


[Python3 regulärer Ausdruck]

函数说明
re.match()从字符串的起始位置匹配一个模式,如果起始位置匹配不成功的话,match()就返回none。
re.search()扫描整个字符串并返回第一个成功的匹配。
re.sub()用于替换字符串中的所有匹配正则表达式的子串,返回替换后的字符串
re.findall()搜索字符串,以列表形式返回全部能匹配的子串
re.split()将字符串按照正则表达式匹配结果进行切割,返回列表
re.finditer()搜索字符串,返回一个匹配结果的迭代类型,每个迭代元素是match对象
>>> match= re.findall(r&#39;[1-9]\d{5}&#39;,&#39;100081BIT  BIT10008676&#39;)>>> print(match)
[&#39;100081&#39;, &#39;100086&#39;]>>> match = re.split(r&#39;[1-9]\d{5}&#39;,&#39;100081BIT  BIT10008676&#39;)>>> match
[&#39;&#39;, &#39;BIT  BIT&#39;, &#39;76&#39;]>>> match = re.split(r&#39;[1-9]\d{5}&#39;,&#39;100081BIT  BIT10008676&#39;,maxsplit=1)>>> match
[&#39;&#39;, &#39;BIT  BIT10008676&#39;]

>>>for m in re.finditer(r&#39;[1-9]\d{5}&#39;,&#39;100081BIT  BIT10008676&#39;):       if m:
            print(m.group(0))    
100081100086
Nach dem Login kopieren
Nach dem Login kopieren

Der Unterschied zwischen re.match und re.search

re.match stimmt nur überein der Anfang der Zeichenfolge, wenn der Anfang der Zeichenfolge nicht mit dem regulären Ausdruck übereinstimmt, schlägt die Übereinstimmung fehl und die Funktion gibt None zurück, während re.search die gesamte Zeichenfolge abgleicht, bis eine Übereinstimmung gefunden wird.


Detaillierte Erklärung regulärer Ausdrücke in Python

Verwandte Empfehlungen:

Detaillierte Erklärung der regulären js-Ausdrücke

php regulär Ausdrücke Ausführliche Erklärung von Ausdrücken_PHP-Tutorial

Sehr wichtige ausführliche Erklärung von regulären PHP-Ausdrücken, detaillierte Erklärung von regulären PHP-Ausdrücken

Das obige ist der detaillierte Inhalt vonDetaillierte Erklärung regulärer Ausdrücke in Python. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Verwandte Etiketten:
Quelle:php.cn
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage