Dans de nombreux scénarios de manipulation de données, il est crucial de déterminer la fréquence de chaque valeur unique dans une colonne de dataframe. Pour répondre à ce besoin, considérons l'ensemble de données suivant :
category cat a cat b cat a
L'objectif est de générer un tableau affichant chaque valeur unique et sa fréquence correspondante :
category freq cat a 2 cat b 1
Pour atteindre ce résultat, le La méthode value_counts() offre une solution simple :
df['category'].value_counts()
Vous pouvez également utiliser la méthode groupby() en tandem avec count() :
df.groupby('category').count()
Les deux techniques résolvent efficacement le problème de la recherche de fréquences de valeurs dans une colonne de trame de données, offrant une compréhension claire de la distribution au sein des données.
Pour plus d'informations et de documentation , reportez-vous à la documentation officielle de Pandas. De plus, si vous le souhaitez, vous pouvez utiliser la méthode transform() pour rajouter la colonne de fréquence à la trame de données d'origine :
df['freq'] = df.groupby('a')['a'].transform('count')
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!