Wie extrahiere ich Text zwischen Zeichenfolgen mithilfe regulärer Ausdrücke?-Python-Tutorial-php.cn

Wie extrahiere ich Text zwischen Zeichenfolgen mithilfe regulärer Ausdrücke?

Barbara Streisand

Freigeben： 2024-10-21 20:07:29

Original

327 Leute haben es durchsucht

How to Extract Text Between Strings Using Regular Expressions?

Abgleich von Text zwischen Zeichenfolgen mithilfe regulärer Ausdrücke

Bei der Arbeit mit Textdaten ist es häufig erforderlich, bestimmte Teile basierend auf vordefinierten Mustern oder Grenzen zu extrahieren . Ein leistungsstarkes Werkzeug für solche Aufgaben sind reguläre Ausdrücke, die eine präzise und effiziente Textmanipulation ermöglichen.

Bedenken Sie das Problem des Extrahierens von Text zwischen zwei bestimmten Zeichenfolgen. Bei einer Zeichenfolge wie „Teil 1. Teil 2. Teil 3, dann mehr Text“ besteht das Ziel darin, den Text zwischen „Teil 1“ und „Teil 3“ zu finden und zu erfassen.

Der reguläre Ausdruck Ansatz

Python bietet eine umfassende Bibliothek regulärer Ausdrücke, mit der dieses Problem gelöst werden kann. Hier ist eine Schritt-für-Schritt-Lösung:

Definieren Sie den regulären Ausdruck (regex):
```
import re
regex = r'Part 1\.(.*?)Part 3'
```
Nach dem Login kopieren
Dieser reguläre Ausdruck gibt an, dass wir Sie suchen nach „Teil 1“, gefolgt von einer beliebigen Anzahl von Zeichen (dargestellt durch „.*?“) vor der Zeichenfolge „Teil 3“.
Erstellen Sie ein Musterobjekt:
```
pattern = re.compile(regex)
```
Nach dem Login kopieren
Führen Sie den Mustervergleich durch:
```
match_obj = pattern.search(string)
```
Nach dem Login kopieren
Rufen Sie die Übereinstimmung ab Text:
```
if match_obj:
    matched_text = match_obj.group(1)
```
Nach dem Login kopieren
Die Methode „group(1)“ extrahiert den in den Klammern im regulären Ausdruck erfassten Text.

Beispielverwendung :

Angenommen die Zeichenfolge „Teil 1. Teil 2. Teil 3, dann mehr Text“, wäre die Ausgabe des Codes:

matched_text = '. Part 2. '

Nach dem Login kopieren

Alternativer Ansatz:

Wenn das Muster mehrfach vorkommt, können Sie die Funktion „re.findall“ anstelle von „re.search“ verwenden, um eine Liste aller Übereinstimmungen zu erhalten.

match_list = re.findall(r'Part 1\.(.*?)Part 3', string)

Nach dem Login kopieren

Das obige ist der detaillierte Inhalt vonWie extrahiere ich Text zwischen Zeichenfolgen mithilfe regulärer Ausdrücke?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!