Regex zum Extrahieren von Übereinstimmungen zwischen zwei Zeichenfolgen
Angenommen, eine große Protokolldatei enthält mehrzeilige Zeichenfolgen, die von bestimmten Start- und Endmarkierungen umgeben sind Ziel ist es, nur die kürzesten Zeichenfolgen zu extrahieren und auszugeben. Allerdings wird die Startmarkierung an anderer Stelle in der Datei verwendet, sodass ein einfacher regulärer Ausdruck nicht ausreicht.
Um dies zu beheben, können wir den folgenden regulären Ausdruck verwenden:
(start((?!start).)*?end)
Dieser reguläre Ausdruck stimmt überein Zeichenfolgen, die:
Verwendet Mit der re.findall-Methode von Python mit dem einzeiligen Modifikator (re.S) können wir alle derartigen Zeichenfolgen aus der Eingabedatei abrufen:
<code class="python">import re text = """ start spam start rubbish start wait for it... profit! here end start garbage start second match win. end """ matches = re.findall('(start((?!start).)*?end)', text, re.S) print(matches)</code>
Dies gibt das gewünschte Ergebnis aus:
['start wait for it... profit! here end', 'start second match win. end']
Das obige ist der detaillierte Inhalt vonWie extrahiere ich Übereinstimmungen zwischen zwei Zeichenfolgen in Protokollen mit einer Regex?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!