Implémentation de la fonction DENSE_RANK() dans Pandas
Lors de l'utilisation de Pandas, vous pouvez rencontrer des situations où vous devez créer l'équivalent de la fonction SQL DENSE_RANK(). Cette fonction attribue des rangs consécutifs aux lignes et traite les valeurs liées comme égales, ce qui est utile pour diverses tâches d'analyse de données.
Dans Pandas, vous pouvez utiliser la méthode pd.Series.rank()
avec les paramètres method='dense'
pour obtenir cette fonctionnalité. Ce paramètre spécifie que la méthode de classement est intensive, garantissant qu'il n'y a pas de lacunes dans les valeurs de classement.
Pour démontrer son utilisation, considérons le bloc de données suivant :
<code>Year Value 2012 10 2013 20 2013 25 2014 30</code>
Pour créer la colonne « Classement » selon la méthode de classement dense, vous pouvez utiliser le code suivant :
<code>df['Rank'] = df.Year.rank(method='dense').astype(int)</code>
Le DataFrame résultant contiendra une colonne "Rank" supplémentaire à laquelle le classement dense est attribué :
<code> Year Value Rank 0 2012 10 1 1 2013 20 2 2 2013 25 2 3 2014 30 3</code>
A noter que les valeurs de 2013 sont à égalité, toutes deux recevant le même rang de 2, démontrant le comportement d'un classement dense.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!