Text zwischen Zeichenfolgen mithilfe regulärer Ausdrücke extrahieren
In Python können Sie reguläre Ausdrücke nutzen, um Text zu extrahieren, der sich zwischen zwei angegebenen Zeichenfolgen innerhalb eines größeren Textes befindet Zeichenfolge. Betrachten Sie das folgende Beispiel:
"Part 1. Part 2. Part 3 then more text"
Ihr Ziel ist es, den Text zwischen „Teil 1“ und „Teil 3“ zu isolieren, also „. Teil 2.“ Um dies zu erreichen, können Sie die Funktion re.search() verwenden:
<code class="python">import re s = 'Part 1. Part 2. Part 3 then more text' match = re.search(r'Part 1\.(.*?)Part 3', s) if match: text_between = match.group(1) print(text_between)</code>
In diesem Fall weist der reguläre Ausdruck r'Part 1.(.*?)Part 3' „.*?“ zu. als Capture-Gruppe. Der "?" stellt sicher, dass diese Gruppe nicht gierig ist, was bedeutet, dass sie die kürzestmögliche Zeichenfolge erfasst, die den regulären Ausdruck erfüllt. Das .* entspricht jedem Zeichen und das . stellt jedes Zeichen außer einem Zeilenumbruch dar.
Wenn mehrere Vorkommen vorhanden sind, können Sie stattdessen re.findall() verwenden:
<code class="python">matches = re.findall(r'Part 1(.*?)Part 3', s) for match in matches: print(match)</code>
Das obige ist der detaillierte Inhalt vonWie extrahiere ich Text zwischen Zeichenfolgen mit regulären Ausdrücken in Python?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!