Tri du DataFrame Pandas par une colonne
Le tri d'un DataFrame Pandas peut être crucial pour organiser et analyser les données. Cet article explore une méthode pour trier un DataFrame en fonction des valeurs d'une colonne spécifique, illustrée à travers un exemple.
Considérez le DataFrame suivant avec une colonne nommée "month_number" contenant des mois représentés par des nombres de 1 à 12 :
0 1 month_number 0 354.7 April 4 1 55.4 August 8 2 176.5 December 12 3 95.5 February 2 4 85.6 January 1 5 152 July 7 6 238.7 June 6 7 104.8 March 3 8 283.5 May 5 9 278.8 November 11 10 249.6 October 10 11 212.7 September 9
Pour trier ce DataFrame par la colonne "month_number", nous pouvons utiliser la méthode sort_values. Voici comment :
sorted_df = df.sort_values('month_number')
Le sorted_df contient désormais les lignes triées par ordre croissant en fonction des valeurs de la colonne "month_number" :
0 1 month_number 4 85.6 January 1 3 95.5 February 2 7 104.8 March 3 0 354.7 April 4 8 283.5 May 5 6 238.7 June 6 5 152.0 July 7 1 55.4 August 8 11 212.7 September 9 10 249.6 October 10 9 278.8 November 11 2 176.5 December 12
Nous pouvons également trier le DataFrame par plusieurs colonnes à l’aide d’une liste d’étiquettes de colonnes. Par exemple, pour trier par "numéro_mois" d'abord puis par "colonne 0", on peut utiliser :
sorted_df = df.sort_values(['month_number', '0'])
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!