Tri d'une trame de données Pandas par plusieurs colonnes
Le tri d'une trame de données Pandas par plusieurs colonnes est une opération courante dans l'analyse des données. Considérons une trame de données avec les colonnes « a », « b » et « c ». Pour trier cette trame de données par colonne « b » par ordre croissant et colonne « c » par ordre décroissant, suivez ces étapes :
À partir de la version 0.17.0 de Pandas, la méthode de tri est obsolète au profit de sort_values. Depuis la version 0.20.0, le tri a été complètement supprimé. Cependant, les arguments et les résultats restent inchangés :
df.sort_values(['a', 'b'], ascending=[True, False])
Une méthode équivalente utilisant la méthode de tri obsolète est :
df.sort(['a', 'b'], ascending=[True, False])
Par exemple, considérons une trame de données df1 avec des valeurs entières aléatoires dans les colonnes 'a' et 'b' :
import pandas as pd import numpy as np df1 = pd.DataFrame(np.random.randint(1, 5, (10, 2)), columns=['a', 'b'])
Tri de cette trame de données par 'a' par ordre croissant et 'b' par ordre décroissant donne :
df1.sort(['a', 'b'], ascending=[True, False])
a b 2 1 4 7 1 3 1 1 2 3 1 2 4 3 2 6 4 4 0 4 3 9 4 3 5 4 1 8 4 1
N'oubliez pas que la méthode de tri n'est pas en place par défaut. Pour mettre à jour df1 avec les valeurs triées, attribuez le résultat de la méthode de tri à df1 ou utilisez inplace=True dans l'appel de méthode :
df1 = df1.sort(['a', 'b'], ascending=[True, False])
ou
df1.sort(['a', 'b'], ascending=[True, False], inplace=True)
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!