Heim > Backend-Entwicklung > Python-Tutorial > Wie kann man mit dem „re'-Modul von Python Phrasen zuverlässig mit Sonderzeichen abgleichen?

Wie kann man mit dem „re'-Modul von Python Phrasen zuverlässig mit Sonderzeichen abgleichen?

DDD
Freigeben: 2024-12-08 02:56:10
Original
665 Leute haben es durchsucht

How to Reliably Match Phrases with Special Characters Using Python's `re` Module?

Unerwartete Ergebnisse mit Wortgrenzen und Sonderzeichen

Beim Versuch, das Vorhandensein einer Phrase sowohl mit regulären als auch mit Sonderzeichen abzugleichen, kann es zu Problemen kommen auf unerwartete Ergebnisse stoßen. Mit dem re-Modul von Python kann ein Muster maskiert und innerhalb einer bestimmten Zeichenfolge durchsucht werden. Während b normalerweise mit Wortgrenzen übereinstimmt, treten Schwierigkeiten auf, wenn das Muster Sonderzeichen enthält.

Betrachten Sie den Beispielsatz „Sortesindex[persons]{Sortes}“. Bei der Suche innerhalb der Zeichenfolge „test Sortesindex[persons]{Sortes} text“ mit re.escape('Sortes\index[persons]{Sortes}') und b wird keine Übereinstimmung gefunden. Dies liegt daran, dass b ein Wortzeichen erfordert, das der Grenze folgt, was nicht der Fall ist, wenn Sonderzeichen vorhanden sind.

Um dies zu beheben, kann ein expliziter Nicht-Wort-Zeichenabgleich oder eine String-Ende-Bedingung erfolgen gebraucht. Das Ersetzen von b durch (W|$) ermöglicht eine erfolgreiche Suche.

Ein umfassenderer Ansatz besteht darin, adaptive Wortgrenzen zu verwenden:

re.search(r'(?:(?!\w)|\b(?=\w)){}(?:(?<=\w)\b|(?<!\w))'.format(re.escape('Sortes\index[persons]{Sortes}')), 'test Sortes\index[persons]{Sortes} test')
Nach dem Login kopieren

Adaptive Wortgrenzen stellen das Vorhandensein von Wortgrenzen ohne sicher erfordern benachbarte Wortzeichen. Sie funktionieren, indem sie Nicht-Wort-Zeichen auf beiden Seiten des Musters ausschließen.

Alternativ können eindeutige Wortgrenzen basierend auf negativen Lookarounds verwendet werden:

re.search(r'(?<!\w){}(?!\w)'.format(re.escape('Sortes\index[persons]{Sortes}')), 'test Sortes\index[persons]{Sortes} test')
Nach dem Login kopieren

Negative Lookarounds garantieren die Abwesenheit von Wörtern Zeichen auf beiden Seiten des Musters.

Zusammenfassend lässt sich sagen, dass beim Abgleichen von Phrasen mit sowohl regulären als auch Sonderzeichen, expliziter Nicht-Wort-Zeichenabgleich, adaptives Wort Grenzen oder eindeutige Wortgrenzen sollten verwendet werden, um die gewünschten Ergebnisse sicherzustellen.

Das obige ist der detaillierte Inhalt vonWie kann man mit dem „re'-Modul von Python Phrasen zuverlässig mit Sonderzeichen abgleichen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Quelle:php.cn
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage