Heim > Backend-Entwicklung > Python-Tutorial > Warum gibt „re.findall' keine überlappenden Regex-Übereinstimmungen zurück und wie können Lookahead-Assertionen dieses Problem lösen?

Warum gibt „re.findall' keine überlappenden Regex-Übereinstimmungen zurück und wie können Lookahead-Assertionen dieses Problem lösen?

Barbara Streisand
Freigeben: 2024-12-06 07:54:11
Original
895 Leute haben es durchsucht

Why Doesn't `re.findall` Return Overlapping Regex Matches, and How Can Lookahead Assertions Solve This?

Aufdecken überlappender Regex-Übereinstimmungen: Tauchen Sie ein in Lookahead-Behauptungen

Problem:
Wenn Sie re.findall verwenden, um ein reguläres Ausdrucksmuster abzugleichen, Warum werden nicht alle überlappenden Übereinstimmungen abgerufen? Warum stimmt der reguläre Ausdruck r'ww' beispielsweise in der Zeichenfolge „hello“ nur mit „he“ und „ll“ überein, nicht aber mit „el“ und „lo“?

Antwort:
Standardmäßig liefert re.findall keine überlappenden Übereinstimmungen. Um dies zu erreichen, verwenden Sie eine Lookahead-Assertion, eine leistungsstarke Regex-Funktion.

Lösung:

# Using a lookahead assertion
matches = re.findall(r'(?=(\w\w))', 'hello')

# Output: ['he', 'el', 'll', 'lo']
Nach dem Login kopieren

Das (?=...)-Konstrukt im Regex ist eine Look-Ahead-Behauptung. Es stimmt überein, wenn das angegebene Muster unmittelbar nach der aktuellen Position erscheint, verbraucht aber keine Zeichen aus der Zeichenfolge. In diesem Fall identifiziert es alle Zwei-Zeichen-Sequenzen („ww“) in „Hallo“, ohne irgendwelche Zeichen zu verbrauchen.

Erklärung:

  • Die Klammer Ausdruck (ww) definiert das zu vergleichende Zwei-Zeichen-Muster.
  • (?=) steht vor dem Muster und zeigt an, dass a Lookahead-Behauptung.
  • Der reguläre Ausdruck 引擎 bewegt den Cursor entlang „Hallo“ und prüft kontinuierlich, ob die nächsten beiden Zeichen mit dem Muster „ww“ übereinstimmen.
  • Wenn ja, wird die aktuelle Position aufgezeichnet als Übereinstimmung.
  • Dieser Prozess wird fortgesetzt, was zur Erkennung aller überlappenden Übereinstimmungen führt: „he“, „el“, „ll“ und „Siehe.“

Das obige ist der detaillierte Inhalt vonWarum gibt „re.findall' keine überlappenden Regex-Übereinstimmungen zurück und wie können Lookahead-Assertionen dieses Problem lösen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Quelle:php.cn
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Neueste Artikel des Autors
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage