Heim Backend-Entwicklung PHP-Tutorial Reguläre Ausdrucksfunktionen, mit denen Sie Text besser verarbeiten können

Reguläre Ausdrucksfunktionen, mit denen Sie Text besser verarbeiten können

Jun 15, 2023 pm 09:28 PM
正则表达式 函数 文本处理

Regulärer Ausdruck ist ein Tool zum Abgleichen von Textmustern, mit dem Sie Inhalte suchen und abgleichen können, die den Anforderungen im Text entsprechen. Diese Suchtechnologie wird häufig in der Textverarbeitung und -programmierung sowie in anderen Bereichen verwendet.

Bei der tatsächlichen Textverarbeitung ist es häufig erforderlich, Textfragmente zu extrahieren, die bestimmten Regeln entsprechen, und einige Vorgänge daran durchzuführen, z. B. Ersetzen, Löschen, Extrahieren usw. Diese Vorgänge können sehr einfach mit regulären Ausdrücken ausgeführt werden. Unabhängig davon, ob es sich um einen Texteditor oder eine Programmiersprache handelt, sind relevante reguläre Ausdrucksfunktionen für Entwickler integriert.

1. Häufig verwendete reguläre Ausdrucksfunktionen

  1. re.compile(Muster, Flags): Kompilieren Sie einen regulären Ausdruck in ein reguläres Ausdrucksobjekt für die spätere Verwendung.
  2. re.search(pattern, string, flags): Suchen Sie nach Übereinstimmungen mit regulären Ausdrücken in der Zeichenfolge und geben Sie das erste übereinstimmende Objekt zurück oder „Keine“, wenn keine Übereinstimmung vorliegt.
  3. re.match(Muster, Zeichenfolge, Flags): Versuchen Sie, den regulären Ausdruck vom Anfang der Zeichenfolge abzugleichen. Wenn die Übereinstimmung erfolgreich ist, geben Sie das erste übereinstimmende Objekt zurück. Wenn es keine Übereinstimmung gibt, geben Sie „Keine“ zurück.
  4. re.findall(pattern, string, flags): Findet alle Elemente in der Zeichenfolge, die mit dem regulären Ausdruck übereinstimmen, und gibt eine Liste oder eine leere Liste zurück, wenn es keine Übereinstimmung gibt.
  5. re.sub(pattern, repl, string, count=0, flags=0): Verwenden Sie repl, um alle Elemente in der Zeichenfolge zu ersetzen, die dem Muster des regulären Ausdrucks entsprechen. Der Parameter count kann verwendet werden, um die Anzahl der Ersetzungen zu begrenzen Es gibt keine Übereinstimmung, dann wird die ursprüngliche Zeichenfolge zurückgegeben.
  6. re.split(pattern, string, maxsplit=0, flags=0): Teilen Sie die Zeichenfolge gemäß dem regulären Ausdrucksmuster auf und geben Sie die Liste zurück. Sie können die Anzahl der Teilungen über den Parameter maxsplit begrenzen ist keine Übereinstimmung, dann wird die ursprüngliche Zeichenfolge zurückgegeben.
  7. re.finditer(pattern, string, flags=0): Findet alle Elemente in der Zeichenfolge, die dem regulären Ausdrucksmuster entsprechen, und gibt einen Iterator zurück, über den nacheinander auf das passende Objekt zugegriffen werden kann.

2. Praktische Anwendungsfälle

  1. Extrahieren von Mobiltelefonnummern:

In tatsächlichen Geschäftsszenarien müssen wir möglicherweise Mobiltelefonnummern aus Text extrahieren, und wir können reguläre Ausdrücke verwenden, um das Muster von Mobiltelefonnummern abzugleichen.

Der Code lautet wie folgt:

import re

text = "我的电话号码是:13888888888,欢迎来电咨询。"

pattern = re.compile(r"1[3456789]d{9}")

res = re.search(pattern, text)

if res:

    print("电话号码:", res.group())

else:

    print("未匹配到电话号码")
Nach dem Login kopieren

Das Ausgabeergebnis ist: Telefonnummer: 13888888888.

  1. Datenbereinigung:

Bei der Datenanalyse kann es erforderlich sein, einige nutzlose Zeichen aus den Daten zu entfernen, wie z. B. bestimmte Satzzeichen, HTML-Tags usw. Diese Funktionalität kann leicht mithilfe regulärer Ausdrücke erreicht werden.

Der Code lautet wie folgt:

import re

text = "<title>数据分析入门指南</title>"

pattern = re.compile(r"<.+?>")

res = re.sub(pattern, "", text)

print(res)
Nach dem Login kopieren

Das Ausgabeergebnis ist: Erste Schritte mit der Datenanalyse.

  1. Überprüfung des E-Mail-Formats:

In Szenarien wie der Benutzerregistrierung und -anmeldung ist es häufig erforderlich, zu überprüfen, ob das E-Mail-Format korrekt ist, was mithilfe regulärer Ausdrücke erreicht werden kann.

Der Code lautet wie folgt:

import re

email = "test@test.com"

pattern = re.compile(r"^w+([-+._]w+)*@w+([-.]w+)*.w+([-.]w+)*$")

res = re.match(pattern, email)

if res:

    print("邮箱格式正确")

else:

    print("邮箱格式错误")
Nach dem Login kopieren

Das Ausgabeergebnis lautet: Das E-Mail-Format ist korrekt.

3. Zusammenfassung

Obwohl reguläre Ausdrücke schwer zu verstehen sind, kann die Beherrschung der relevanten Funktionen und grammatikalischen Regeln eine wichtige Rolle bei der Textverarbeitung, Programmierung usw. spielen. Zu den häufig verwendeten regulären Ausdrucksfunktionen gehören re.compile(), re.search(), re.match(), re.findall(), re.sub(), re.split(), re.finditer() usw. , Funktionen wie Textsuche, Bereinigung, Formatprüfung usw. können problemlos implementiert werden. Bei der tatsächlichen Verwendung ist es erforderlich, geeignete Muster für reguläre Ausdrücke entsprechend verschiedenen Szenarien auszuwählen, um die Verarbeitungseffizienz und -genauigkeit zu verbessern.

Das obige ist der detaillierte Inhalt vonReguläre Ausdrucksfunktionen, mit denen Sie Text besser verarbeiten können. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

Clothoff.io

KI-Kleiderentferner

AI Hentai Generator

AI Hentai Generator

Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Beste grafische Einstellungen
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. So reparieren Sie Audio, wenn Sie niemanden hören können
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

Heiße Werkzeuge

Notepad++7.3.1

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Tipps zum dynamischen Erstellen neuer Funktionen in Golang-Funktionen Tipps zum dynamischen Erstellen neuer Funktionen in Golang-Funktionen Apr 25, 2024 pm 02:39 PM

Die Go-Sprache bietet zwei Technologien zur dynamischen Funktionserstellung: Schließung und Reflexion. Abschlüsse ermöglichen den Zugriff auf Variablen innerhalb des Abschlussbereichs, und durch Reflektion können mithilfe der FuncOf-Funktion neue Funktionen erstellt werden. Diese Technologien sind nützlich bei der Anpassung von HTTP-Routern, der Implementierung hochgradig anpassbarer Systeme und dem Aufbau steckbarer Komponenten.

Überlegungen zur Parameterreihenfolge bei der Benennung von C++-Funktionen Überlegungen zur Parameterreihenfolge bei der Benennung von C++-Funktionen Apr 24, 2024 pm 04:21 PM

Bei der Benennung von C++-Funktionen ist es wichtig, die Reihenfolge der Parameter zu berücksichtigen, um die Lesbarkeit zu verbessern, Fehler zu reduzieren und das Refactoring zu erleichtern. Zu den gängigen Konventionen für die Parameterreihenfolge gehören: Aktion-Objekt, Objekt-Aktion, semantische Bedeutung und Einhaltung der Standardbibliothek. Die optimale Reihenfolge hängt vom Zweck der Funktion, den Parametertypen, möglichen Verwirrungen und Sprachkonventionen ab.

Wie validiere ich eine E-Mail-Adresse in Golang mithilfe eines regulären Ausdrucks? Wie validiere ich eine E-Mail-Adresse in Golang mithilfe eines regulären Ausdrucks? May 31, 2024 pm 01:04 PM

Um E-Mail-Adressen in Golang mithilfe regulärer Ausdrücke zu validieren, führen Sie die folgenden Schritte aus: Verwenden Sie regexp.MustCompile, um ein reguläres Ausdrucksmuster zu erstellen, das gültigen E-Mail-Adressformaten entspricht. Verwenden Sie die MatchString-Funktion, um zu überprüfen, ob eine Zeichenfolge mit einem Muster übereinstimmt. Dieses Muster deckt die meisten gültigen E-Mail-Adressformate ab, einschließlich: Lokale Benutzernamen können Buchstaben, Zahlen und Sonderzeichen enthalten: !.#$%&'*+/=?^_{|}~-`Domänennamen müssen mindestens Eins enthalten Buchstabe, gefolgt von Buchstaben, Zahlen oder Bindestrichen. Die Top-Level-Domain (TLD) darf nicht länger als 63 Zeichen sein.

Wie schreibe ich effiziente und wartbare Funktionen in Java? Wie schreibe ich effiziente und wartbare Funktionen in Java? Apr 24, 2024 am 11:33 AM

Der Schlüssel zum Schreiben effizienter und wartbarer Java-Funktionen ist: Halten Sie es einfach. Verwenden Sie eine aussagekräftige Benennung. Bewältigen Sie besondere Situationen. Nutzen Sie entsprechende Sichtbarkeit.

Wie kann ich Zeitstempel mithilfe regulärer Ausdrücke in Go abgleichen? Wie kann ich Zeitstempel mithilfe regulärer Ausdrücke in Go abgleichen? Jun 02, 2024 am 09:00 AM

In Go können Sie reguläre Ausdrücke verwenden, um Zeitstempel abzugleichen: Kompilieren Sie eine Zeichenfolge mit regulären Ausdrücken, z. B. die, die zum Abgleich von ISO8601-Zeitstempeln verwendet wird: ^\d{4}-\d{2}-\d{2}T \d{ 2}:\d{2}:\d{2}(\.\d+)?(Z|[+-][0-9]{2}:[0-9]{2})$ . Verwenden Sie die Funktion regexp.MatchString, um zu überprüfen, ob eine Zeichenfolge mit einem regulären Ausdruck übereinstimmt.

Vollständige Sammlung von Excel-Funktionsformeln Vollständige Sammlung von Excel-Funktionsformeln May 07, 2024 pm 12:04 PM

1. Die SUMME-Funktion wird verwendet, um die Zahlen in einer Spalte oder einer Gruppe von Zellen zu summieren, zum Beispiel: =SUMME(A1:J10). 2. Die Funktion AVERAGE wird verwendet, um den Durchschnitt der Zahlen in einer Spalte oder einer Gruppe von Zellen zu berechnen, zum Beispiel: =AVERAGE(A1:A10). 3. COUNT-Funktion, die verwendet wird, um die Anzahl der Zahlen oder Texte in einer Spalte oder einer Gruppe von Zellen zu zählen, zum Beispiel: =COUNT(A1:A10) 4. IF-Funktion, die verwendet wird, um logische Urteile auf der Grundlage spezifizierter Bedingungen zu treffen und die zurückzugeben entsprechendes Ergebnis.

Wie überprüfe ich das Passwort mithilfe eines regulären Ausdrucks in Go? Wie überprüfe ich das Passwort mithilfe eines regulären Ausdrucks in Go? Jun 02, 2024 pm 07:31 PM

Die Methode zur Verwendung regulärer Ausdrücke zur Überprüfung von Passwörtern in Go lautet wie folgt: Definieren Sie ein Muster für reguläre Ausdrücke, das die Mindestanforderungen für Passwörter erfüllt: mindestens 8 Zeichen, einschließlich Kleinbuchstaben, Großbuchstaben, Zahlen und Sonderzeichen. Kompilieren Sie reguläre Ausdrucksmuster mit der MustCompile-Funktion aus dem Regexp-Paket. Verwenden Sie die MatchString-Methode, um zu testen, ob die Eingabezeichenfolge mit einem regulären Ausdrucksmuster übereinstimmt.

Was ist der Unterschied zwischen benutzerdefinierten PHP-Funktionen und vordefinierten Funktionen? Was ist der Unterschied zwischen benutzerdefinierten PHP-Funktionen und vordefinierten Funktionen? Apr 22, 2024 pm 02:21 PM

Der Unterschied zwischen benutzerdefinierten PHP-Funktionen und vordefinierten Funktionen ist: Umfang: Benutzerdefinierte Funktionen sind auf den Umfang ihrer Definition beschränkt, während auf vordefinierte Funktionen im gesamten Skript zugegriffen werden kann. So definieren Sie: Benutzerdefinierte Funktionen werden mit dem Schlüsselwort function definiert, während vordefinierte Funktionen vom PHP-Kernel definiert werden. Parameterübergabe: Benutzerdefinierte Funktionen empfangen Parameter, während vordefinierte Funktionen möglicherweise keine Parameter erfordern. Erweiterbarkeit: Benutzerdefinierte Funktionen können nach Bedarf erstellt werden, während vordefinierte Funktionen integriert sind und nicht geändert werden können.

See all articles