Messen der String-Ähnlichkeit in Python
Das Bestimmen der Ähnlichkeit zwischen zwei Strings ist eine häufige Aufgabe bei der Datenanalyse und der Verarbeitung natürlicher Sprache. In Python bietet die Difflib-Bibliothek eine praktische Möglichkeit, die Ähnlichkeit von Zeichenfolgen mithilfe der SequenceMatcher-Klasse zu quantifizieren.
Ähnlichkeitswahrscheinlichkeit berechnen
Zur Berechnung der Wahrscheinlichkeit, dass eine Zeichenfolge existiert Verwenden Sie ähnlich wie bei einer anderen Zeichenfolge die folgenden Schritte:
def similar(a, b): return SequenceMatcher(None, a, b).ratio()
Die SequenceMatcher-Klasse stellt eine ratio()-Methode bereit, die einen Dezimalwert zwischen 0 und 1 zurückgibt, wobei 1 angibt eine perfekte Übereinstimmung und 0 bedeutet keine Ähnlichkeit.
Beispiel Verwendung
Um die Ähnlichkeit zwischen zwei Zeichenfolgen wie „Apple“ und „Appel“ zu berechnen, verwenden Sie den folgenden Code:
result = similar("Apple", "Appel") print(result)
Dies gibt 0,8 aus, was einen Höchstwert anzeigt Grad der Ähnlichkeit. Um weniger ähnliche Zeichenfolgen wie „Apple“ und „Mango“ zu vergleichen, würde der Code 0,0 ausgeben, was auf keine Ähnlichkeit hinweist.
Mit der SequenceMatcher-Klasse können Sie die Ähnlichkeit zwischen Zeichenfolgen in Python effektiv messen und erhalten ein Wahrscheinlichkeitswert, der den Grad der Ähnlichkeit zwischen den beiden Zeichenfolgen quantifiziert.
Das obige ist der detaillierte Inhalt vonWie kann die „difflib'-Bibliothek von Python verwendet werden, um die Ähnlichkeit von Zeichenfolgen zu messen und eine Ähnlichkeitswahrscheinlichkeit zu berechnen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!