Python compte le nombre d'occurrences de mots
Pour faire des statistiques de fréquence de mots, utiliser le dictionnaire est sans aucun doute le plus approprié Type de données. Le mot est utilisé comme clé du dictionnaire et le nombre de fois où le mot apparaît est utilisé comme valeur du dictionnaire. Il est très pratique d'enregistrer la fréquence de chaque mot. Le dictionnaire ressemble beaucoup à notre téléphone. livre, et chaque nom est associé à un numéro de téléphone.
Ce qui suit est le code d'implémentation spécifique, qui lit les mots du fichier importthis.txt et compte les 5 mots avec le plus d'occurrences.
# -*- coding:utf-8 -*- import io import re class Counter: def __init__(self, path): """ :param path: 文件路径 """ self.mapping = dict() with io.open(path, encoding="utf-8") as f: data = f.read() words = [s.lower() for s in re.findall("\w+", data)] for word in words: self.mapping[word] = self.mapping.get(word, 0) + 1 def most_common(self, n): assert n > 0, "n should be large than 0" return sorted(self.mapping.items(), key=lambda item: item[1], reverse=True)[:n] if __name__ == '__main__': most_common_5 = Counter("importthis.txt").most_common(5) for item in most_common_5: print(item)
Effet d'exécution :
('is', 10) ('better', 8) ('than', 8) ('the', 6) ('to', 5)
Plus de tutoriels Python, apprentissage recommandé : Tutoriel vidéo Python
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!