Erfassen wiederholter Untermuster in Python Regex
Beim Abgleich komplexer Muster kann die Erfassung sich wiederholender Untermuster die Regex-Leistung verbessern. Während reguläre Python-Ausdrücke Einschränkungen bei der Wiederholung von Erfassungen haben, gibt es Problemumgehungen, um gewünschte Muster effektiv zu erfassen.
Aufteilen und Verketten
Ein in der bereitgestellten Antwort vorgeschlagener Ansatz ist um zunächst das gesamte Muster abzugleichen und die Teilmuster später aufzuteilen. Dieser Ansatz vereinfacht den regulären Ausdruck, erfordert jedoch zusätzliche Schritte zur Aufteilung. Erwägen Sie beispielsweise übereinstimmende E-Mail-Adressen:
import re pattern = r'(.+?)@(\w+\.\w+)' text = "yasar@webmail.something.edu.tr" match = re.match(pattern, text) if match: email_address, domain = match.groups() subdomains = domain.split(".")
Regex-Gruppen
Wenn das Muster komplexer ist und die Untermuster unterschiedliche Merkmale aufweisen, können Regex-Gruppen (d. h. Klammern) verwendet werden ) können verwendet werden, um sie direkt zu erfassen. Betrachten Sie das folgende Muster:
pattern = r'(\w+)?\((\d+) entries?\)'
Dieses Muster entspricht einem Wort und einem optionalen Klammerausdruck, der eine Zahl und den Text „Einträge“ (oder „Eintrag“) enthält. Auf die erfassten Gruppen kann über das Match-Objekt zugegriffen werden:
text = "Received 10 entries for yesterday" match = re.match(pattern, text) if match: word, count = match.groups() if word: print("Word:", word) if count: print("Count:", count)
Dieser Ansatz ermöglicht die direkte Erfassung von Untermustern, ohne dass komplexe Aufteilungsroutinen erforderlich sind.
Das obige ist der detaillierte Inhalt vonKann Python Regex wiederholte Untermuster effektiv erfassen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!