Heim > Backend-Entwicklung > Python-Tutorial > So verwenden Sie reguläre Ausdrücke in Python

So verwenden Sie reguläre Ausdrücke in Python

王林
Freigeben: 2023-06-10 08:25:00
Original
3016 Leute haben es durchsucht

Python unterstützt als beliebte Programmiersprache die Verwendung regulärer Ausdrücke zum Verarbeiten und Betreiben von Zeichenfolgendaten. Regulärer Ausdruck ist eine Methode zur Beschreibung der Eigenschaften einer Zeichenfolge, die zum Abgleichen, Filtern und Ersetzen des Inhalts in der Zeichenfolge verwendet werden kann. Verwenden Sie in Python die vom re-Modul bereitgestellte Funktionsbibliothek, um reguläre Ausdrücke zu bedienen und zu verarbeiten.

1. Grundlagen regulärer Ausdrücke

In regulären Ausdrücken werden einige Sonderzeichen verwendet, um bestimmte Muster in Zeichenfolgen abzugleichen. Die einfachsten regulären Ausdrücke sind gewöhnliche Zeichen wie a, b oder c usw. Diese Zeichen stimmen nur mit sich selbst überein. Darüber hinaus unterstützen reguläre Ausdrücke auch die folgenden Sonderzeichen:

  • bedeutet Übereinstimmung mit jedem einzelnen Zeichen.
  • w bedeutet Übereinstimmung mit jedem einzelnen Buchstaben, jeder Zahl oder jedem Unterstrich.
  • d bedeutet Übereinstimmung mit jedem einzelnen numerischen Zeichen.
  • s bedeutet Übereinstimmung Jedes einzelne Leerzeichen, Tabulatorzeichen oder Zeilenumbruchzeichen
    • bedeutet Übereinstimmung mit 0 oder mehr vorherigen Zeichen
    • bedeutet Übereinstimmung mit 1 oder mehreren vorherigen Zeichen
  • bedeutet Übereinstimmung mit 0 oder 1 vorhergehenden Zeichen
  • [] bedeutet Definition ein Zeichensatz
  • |. bedeutet der OR-Operator
  • () bedeutet Gruppierung

Der folgende Code zeigt den einfachsten regulären Ausdruck, der nur mit den Zeichen in der Zeichenfolge Buchstabe a übereinstimmt:

import re

text = "Hello world"
pattern = 'a'

match = re.findall(pattern, text)
print(match)
Nach dem Login kopieren

Wir können sehen, dass nur die leere Liste wird gedruckt, weil die Zeichenfolge kein Zeichen a enthält. Schauen wir uns nun an, wie man ein Wort mithilfe eines regulären Ausdrucks zuordnet:

import re

text = "Hello world"
pattern = r"w+"

match = re.findall(pattern, text)
print(match)
Nach dem Login kopieren

Jetzt haben wir eine Liste mit zwei Wörtern. In diesem regulären Ausdruck stellt Wortgrenzen dar und w+ stellt übereinstimmende Wörter dar, die aus einem oder mehreren Wortzeichen bestehen. 表示单词边界,w+表示匹配由一个或多个单词字符组成的单词。

2.使用re模块进行匹配

在Python中,使用re模块可以进行多种字符串匹配操作,包括:

  • re.search(pattern, string[, flags]):搜索匹配pattern的第一个位置,并返回匹配对象。
  • re.match(pattern, string[, flags]):从字符串的开头匹配pattern,如果匹配成功返回匹配对象。
  • re.findall(pattern, string[, flags]):找到所有匹配pattern的子串,并将它们作为列表返回。
  • re.finditer(pattern, string[, flags]):找到所有匹配pattern的子串,并返回它们的迭代器。
  • re.sub(pattern, repl, string[, count, flags]):将字符串中匹配pattern的所有子串用repl替换。
  • re.split(pattern, string[, maxsplit, flags]):根据正则表达式pattern分割字符串,并将结果作为列表返回。

下面的代码展示了如何使用re模块中的search()findall()函数来匹配正则表达式:

import re

text = "The quick brown fox jumps over the lazy dog."
pattern = r"w{3}"

match = re.search(pattern, text)
if match:
    print("Found match:", match.group(0))
else:
    print("No match found")

matches = re.findall(pattern, text)
print("Found matches:", matches)
Nach dem Login kopieren

在上面的代码中,我们首先使用search()函数来查找字符串中的第一个匹配项。如果找到,它将返回MatchObject对象,否则返回None。我们还使用了findall()函数,它将返回所有匹配的字符串列表。

3.分组

在正则表达式中,括号()表示分组。分组可以帮助我们将正则表达式中的子表达式组合起来,以便更方便地匹配和查找字符串。我们可以使用group()groups()函数来访问分组后的子表达式。

下面的代码展示了如何使用分组来匹配IP地址:

import re

ip_address = "192.168.1.1"
pattern = r"(d{1,3}).(d{1,3}).(d{1,3}).(d{1,3})"

match = re.search(pattern, ip_address)
print("IP address:", match.group(0))
print("First octet:", match.group(1))
print("Second octet:", match.group(2))
print("Third octet:", match.group(3))
print("Fourth octet:", match.group(4))
Nach dem Login kopieren

我们使用的正则表达式 (d{1,3}).(d{1,3}).(d{1,3}).(d{1,3}) 将IP地址分成了四个部分。然后,我们使用group()函数来访问每个部分。

4.使用re.sub()函数进行替换

re.sub()函数可以使用正则表达式从字符串中删除、替换或修改子串。下面的代码展示如何使用re.sub()函数在字符串中替换子串:

import re

text = "The quick brown fox jumps over the lazy dog."
pattern = r"fox"

new_text = re.sub(pattern, "cat", text)
print(new_text)
Nach dem Login kopieren

在上面的代码中,我们使用re.sub()

2. Verwenden Sie das re-Modul zum Abgleichen

In Python können Sie das re-Modul verwenden, um eine Vielzahl von String-Matching-Vorgängen durchzuführen, darunter:

🎜re.search(pattern, string[, flags]) : Suchen Sie nach dem ersten Positionsübereinstimmungsmuster und geben Sie das übereinstimmende Objekt zurück. 🎜🎜re.match(pattern, string[, flags]): Muster vom Anfang der Zeichenfolge abgleichen und das übereinstimmende Objekt zurückgeben, wenn die Übereinstimmung erfolgreich ist. 🎜🎜re.findall(pattern, string[, flags]): Alle Teilzeichenfolgen finden, die zum Muster passen, und sie als Liste zurückgeben. 🎜🎜re.finditer(pattern, string[, flags]): Findet alle Teilzeichenfolgen, die mit dem Muster übereinstimmen, und gibt ihre Iteratoren zurück. 🎜🎜re.sub(pattern, repl, string[, count, flags]): Ersetzen Sie alle Teilzeichenfolgen, die mit dem Muster in der Zeichenfolge übereinstimmen, durch repl. 🎜🎜re.split(pattern, string[, maxsplit, flags]): Teilen Sie die Zeichenfolge gemäß dem regulären Ausdrucksmuster und geben Sie das Ergebnis als Liste zurück. 🎜🎜🎜Der folgende Code zeigt, wie die Funktionen search() und findall() im re-Modul verwendet werden, um reguläre Ausdrücke abzugleichen: 🎜rrreee🎜Im obigen Code Wir verwenden zunächst die Funktion search(), um die erste Übereinstimmung in der Zeichenfolge zu finden. Wenn es gefunden wird, wird das Objekt MatchObject zurückgegeben, andernfalls wird None zurückgegeben. Wir haben auch die Funktion findall() verwendet, die eine Liste aller übereinstimmenden Zeichenfolgen zurückgibt. 🎜🎜3. Gruppierung🎜🎜In regulären Ausdrücken stehen Klammern () für die Gruppierung. Durch die Gruppierung können wir Unterausdrücke in regulären Ausdrücken kombinieren, um das Zuordnen und Auffinden von Zeichenfolgen zu erleichtern. Wir können die Funktion group() oder groups() verwenden, um auf gruppierte Unterausdrücke zuzugreifen. 🎜🎜Der folgende Code zeigt, wie man die Gruppierung verwendet, um IP-Adressen abzugleichen: 🎜rrreee🎜Wir verwenden den regulären Ausdruck (d{1,3}).(d{1,3}).(d{1, 3 }).(d{1,3}) teilt die IP-Adresse in vier Teile. Anschließend verwenden wir die Funktion group(), um auf jeden Abschnitt zuzugreifen. 🎜🎜4. Verwenden Sie die Funktion re.sub() zum Ersetzen. Die Funktion re.sub() kann reguläre Ausdrücke verwenden, um Teilzeichenfolgen aus Zeichenfolgen zu löschen, zu ersetzen oder zu ändern. Der folgende Code zeigt, wie man einen Teilstring in einem String mit der Funktion re.sub() ersetzt: 🎜rrreee🎜 Im obigen Code verwenden wir die Funktion re.sub(), um die Wörter in zu ersetzen Die Zeichenfolge Ersetzen Sie „fox“ durch „cat“ und geben Sie die ersetzte Zeichenfolge aus. Wenn wir die Anzahl der angegebenen Ersetzungen steuern möchten, fügen Sie einfach einen optionalen Zählparameter zur Funktion re.sub() hinzu. 🎜🎜5. Fazit🎜🎜Reguläre Ausdrücke in Python sind sehr leistungsfähig und können verschiedene komplexe Zeichenfolgenmuster abgleichen. Wir können die Funktionen im re-Modul verwenden, um Operationen im Zusammenhang mit regulären Ausdrücken abzuschließen. Reguläre Ausdrücke sind ein sehr nützliches Werkzeug, wenn es um die Verarbeitung von Zeichenfolgen geht. 🎜

Das obige ist der detaillierte Inhalt vonSo verwenden Sie reguläre Ausdrücke in Python. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Verwandte Etiketten:
Quelle:php.cn
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage