Maison > développement back-end > Tutoriel Python > Comment compter efficacement les occurrences de termes dans les combinaisons de groupes ID dans un DataFrame Pandas ?

Comment compter efficacement les occurrences de termes dans les combinaisons de groupes ID dans un DataFrame Pandas ?

Linda Hamilton
Libérer: 2024-12-06 15:23:13
original
600 Les gens l'ont consulté

How to Efficiently Count Term Occurrences within ID-Group Combinations in a Pandas DataFrame?

Comment effectuer un décompte de valeurs groupby sur une trame de données pandas ?

Vous devez regrouper la trame de données par les colonnes « id » et « group » et calculer le nombre de chacun valeur unique dans la colonne « terme » pour chaque paire unique de valeurs « id » et « groupe ». En d'autres termes, vous devez déterminer la fréquence à laquelle chaque terme apparaît dans chaque combinaison id-group.

Vous pouvez y parvenir en utilisant les fonctions groupby et size des pandas :

df.groupby(['id', 'group', 'term']).size().unstack(fill_value=0)
Copier après la connexion

Cela produira une table avec l'identifiant et le groupe comme indices et le terme comme colonnes.

Timing

Cette méthode est très efficace, même pour les grands ensembles de données. Pour une trame de données de 1 000 000 de lignes, l'exécution du code ci-dessus ne prend que 6 secondes environ.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Derniers articles par auteur
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal