Heim > Backend-Entwicklung > Python-Tutorial > Wie ordne ich mehrzeilige Blöcke in Python mithilfe regulärer Ausdrücke zu?

Wie ordne ich mehrzeilige Blöcke in Python mithilfe regulärer Ausdrücke zu?

Susan Sarandon
Freigeben: 2024-10-24 22:16:02
Original
879 Leute haben es durchsucht

How to Match Multiline Blocks in Python Using Regular Expressions?

Mehrzeilige Blöcke mit regulären Ausdrücken abgleichen

Beim Abgleich mit Text, der sich über mehrere Zeilen erstreckt, können mit den regulären Ausdrücken von Python Schwierigkeiten auftreten. Betrachten Sie den folgenden Beispieltext:

some Varying TEXT

DSJFKDAFJKDAFJDSAKFJADSFLKDLAFKDSAF
[more of the above, ending with a newline]
[yep, there is a variable number of lines here]

(repeat the above a few hundred times).
Nach dem Login kopieren

Das Ziel besteht darin, zwei Komponenten zu erfassen:

  • „irgendein variierender TEXT“
  • Alle Großbuchstaben befinden sich zwei Zeilen darunter it (ausgenommen etwaige Zeilenumbrüche)

Mehrere Ansätze wurden erfolglos versucht:

<code class="python">re.compile(r"^>(\w+)$$(\n[.$]+)^$", re.MULTILINE) # Capture both parts
re.compile(r"([^>][\w\s]+)$", re.MULTILINE|re.DOTALL) # Just textlines</code>
Nach dem Login kopieren

Um dieses Problem zu beheben, verwenden Sie den folgenden regulären Ausdruck:

<code class="python">re.compile(r"^(.+)\n((?:\n.+)+)", re.MULTILINE)</code>
Nach dem Login kopieren

Beachten Sie, dass die Anker „^“ und „$“ nicht mit Zeilenumbrüchen übereinstimmen. Daher folgt im Mehrzeilenmodus „^“ einem Zeilenumbruch und „$“ geht einem Zeilenumbruch voran.

Achten Sie außerdem auf verschiedene Zeilenumbruchformate. Für Text, der Zeilenvorschübe, Wagenrückläufe oder beides enthalten kann, verwenden Sie diesen umfassenderen regulären Ausdruck:

<code class="python">re.compile(r"^(.+)(?:\n|\r\n?)((?:(?:\n|\r\n?).+)+)", re.MULTILINE)</code>
Nach dem Login kopieren

Der Modifikator DOTALL ist hier unnötig, da der Punkt bereits Zeilenumbrüche ausschließt.

Das obige ist der detaillierte Inhalt vonWie ordne ich mehrzeilige Blöcke in Python mithilfe regulärer Ausdrücke zu?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Quelle:php.cn
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Neueste Artikel des Autors
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage