Mesurer la similarité des chaînes avec la bibliothèque standard de Python
Quantifier la similarité entre deux chaînes est une tâche précieuse dans diverses applications. Python propose une bibliothèque standard qui fournit une solution pratique à cet effet.
Problème :
Comment pouvons-nous déterminer la probabilité qu'une chaîne soit similaire à une autre chaîne en Python ? Nous visons à obtenir une valeur décimale, telle que 0,9 (90 %), pour représenter le niveau de similarité.
Solution :
Le module difflib de Python inclut la classe SequenceMatcher, ce qui facilite le calcul de la similarité des chaînes. La méthode ratio() de cette classe renvoie une valeur décimale comprise dans la plage [0, 1], où 0 indique aucune similarité et 1 indique une similarité complète.
Implémentation :
from difflib import SequenceMatcher def similar(a, b): return SequenceMatcher(None, a, b).ratio()
Exemple d'utilisation :
>>> similar("Apple", "Appel") 0.8 >>> similar("Apple", "Mango") 0.0
Ces exemples illustrent que "Apple" et "Appel" ont un score de similarité élevé (0,8) en raison de leur orthographe proche, tandis que "Apple" et "Mango" ont un faible score de similarité (0,0) car ils sont très différents.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!