Finden Sie ähnlichen Text mithilfe regulärer Ausdrücke
Der reguläre Ausdruck des PHP-Editors Yuzi ist ein leistungsstarkes Textvergleichstool, mit dem wir schnell ähnlichen Text finden können. Ob bei der String-Verarbeitung, der Datenextraktion oder der Validierung von Eingaben, reguläre Ausdrücke spielen eine wichtige Rolle. Seine Flexibilität und Effizienz ermöglichen es uns, komplexe Textoperationen bequemer abzuwickeln und so die Entwicklungseffizienz erheblich zu verbessern. Egal, ob Sie Anfänger oder erfahrener Entwickler sind, die Beherrschung regulärer Ausdrücke ist eine wesentliche Fähigkeit. Lassen Sie uns gemeinsam ihren Charme erkunden!
Frageninhalt
Ich habe Textlisten in verschiedenen PDF-Dokumenten identifiziert. Jetzt muss ich mithilfe regulärer Ausdrücke einige Werte aus jedem Text extrahieren. Einige meiner Muster sehen so aus:
some text[ -]?(.+)[ ,-]+some other text
Aber das Problem ist, dass einige Buchstaben nach der Erkennung möglicherweise falsch sind ("0"
代替 "o"
、"i"
代替 "l"
usw.). Deshalb passt mein Muster nicht dazu.
Ich möchte einen regulären Ausdruck wie Jaro-Winkler oder Levenshtein-Ähnlichkeit verwenden, damit ich mit s0me 文本 my_value、一些其他文本
等文本中提取 my_value
beginnen kann.
Ich weiß, das sieht großartig aus. Aber vielleicht gibt es eine Lösung für dieses Problem.
Übrigens verwende ich Java, aber Lösungen in anderen Sprachen sind akzeptabel.
Problemumgehung:
Sie können Fuzzy-Matching verwenden, wenn Sie das regex
-Modul in Python verwenden. Der folgende reguläre Ausdruck erlaubt bis zu 2 Fehler pro Phrase. Sie können komplexere Fehlertests verwenden (für Einfügungen, Ersetzungen und Löschungen). Einzelheiten finden Sie in der verlinkten Dokumentation.
import regex txt = 's0me text my_value, some otner text' pattern = regex.compile(r'(?:some text){e<=2}[ -]?(.+?)[ ,-]+(?:some other text){e<=2}') m = pattern.search(txt) if m is not none: print(m.group(1))
Ausgabe:
my_value
Das Muster für reguläre Ausdrücke (?i)(somes*w*s*texts*)([^,]+)
wird verwendet, um Phrasen zu erfassen, die „etwas Text“ ähneln, gefolgt von beliebigen Zeichen vor einem Komma
Das obige ist der detaillierte Inhalt vonFinden Sie ähnlichen Text mithilfe regulärer Ausdrücke. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

Video Face Swap
Tauschen Sie Gesichter in jedem Video mühelos mit unserem völlig kostenlosen KI-Gesichtstausch-Tool aus!

Heißer Artikel

Heiße Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)
