Heim > Backend-Entwicklung > Python-Tutorial > Wie kann ich Teilzeichenfolgen zwischen Markierungen in Python mithilfe regulärer Ausdrücke extrahieren?

Wie kann ich Teilzeichenfolgen zwischen Markierungen in Python mithilfe regulärer Ausdrücke extrahieren?

Susan Sarandon
Freigeben: 2024-12-02 16:32:11
Original
1014 Leute haben es durchsucht

How Can I Extract Substrings Between Markers in Python Using Regular Expressions?

Abgleichen von Teilzeichenfolgen zwischen Markern in Python

Wenn Sie in Python mit Zeichenfolgen arbeiten, müssen Sie möglicherweise eine bestimmte Teilzeichenfolge extrahieren, die sich zwischen zwei befindet bekannte Marker. Diese Aufgabe kann mit regulären Ausdrücken gelöst werden, einem leistungsstarken Werkzeug für den Mustervergleich.

Lösung mit regulären Ausdrücken

Um die Teilzeichenfolge zwischen Markierungen in Python zu extrahieren, befolgen Sie diese Schritte :

  1. Importieren Sie das re-Modul für reguläre Ausdrucksfunktionen.
  2. Verwenden Sie die re.search()-Methode, um Suchen Sie nach dem Muster, das mit den Markierungen und der interessierenden Teilzeichenfolge übereinstimmt.
  3. Wenn das Muster gefunden wird, rufen Sie die übereinstimmende Teilzeichenfolge mit der Methode „group()“ ab.
  4. Weisen Sie die extrahierte Teilzeichenfolge einer Variablen zu zur weiteren Verwendung.

Beispiel

Beachten Sie den folgenden Code Snippet:

import re

text = 'gfgfdAAA1234ZZZuijjk'

m = re.search('AAA(.+?)ZZZ', text)
if m:
    found = m.group(1)

# found: '1234'
Nach dem Login kopieren

In diesem Beispiel enthält der String-Text den interessierenden Teilstring, der sich zwischen den Markern „AAA“ und „ZZZ“ befindet. Mit der Funktion re.search() suchen wir nach dem Muster „AAA(. ?)ZZZ“. Das (. ?)部分匹配零个或更多字符,尽可能短。

Wenn das Muster gefunden wird, rufen wir die übereinstimmende Teilzeichenfolge mit m.group(1) ab, wobei 1 die erste einfangende Gruppe in angibt das Muster. Der extrahierte Teilstring wird dann in der gefundenen Variablen gespeichert.

Alternativ können Sie den folgenden Ansatz verwenden:

import re

text = 'gfgfdAAA1234ZZZuijjk'

try:
    found = re.search('AAA(.+?)ZZZ', text).group(1)
except AttributeError:
    # AAA, ZZZ not found in the original string
    found = ''

# found: '1234'
Nach dem Login kopieren

Dieser Ansatz behandelt den Fall, in dem die Markierungen nicht im Originalstring gefunden werden durch Bereitstellung eines Standardverhaltens im Except-Block.

Das obige ist der detaillierte Inhalt vonWie kann ich Teilzeichenfolgen zwischen Markierungen in Python mithilfe regulärer Ausdrücke extrahieren?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Quelle:php.cn
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Neueste Artikel des Autors
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage