Tri personnalisé dans Pandas Dataframe
Dans Pandas, un tri personnalisé peut être réalisé pour organiser les colonnes en fonction de critères spécifiques, tels que le regroupement des mois dans un ordre particulier.
Une méthode de tri personnalisé consiste à utiliser un dictionnaire. Par exemple, si vous disposez d'un dictionnaire qui mappe les noms de mois selon l'ordre de tri souhaité, vous pouvez trier la colonne comme suit :
custom_dict = {'March': 0, 'April': 1, 'Dec': 3} s = df['m'].apply(lambda x: custom_dict[x]) df.sort_values(s)
Cela triera la colonne « m » en fonction de l'ordre spécifié dans « custom_dict'. Les mois non inclus dans le dictionnaire se verront attribuer une valeur manquante (NaN) et placés au bas de la colonne triée.
Une approche plus élégante introduite dans Pandas 0.15 consiste à utiliser des séries catégorielles. En spécifiant l'ordre de tri souhaité lors de la conversion de la colonne du mois en une série catégorielle, vous pouvez obtenir le même résultat :
df['m'] = pd.Categorical(df['m'], ["March", "April", "Dec"]) df.sort_values("m")
En un mot, le tri personnalisé dans pandas offre la flexibilité de regrouper et d'ordonner les colonnes en fonction de critères spécifiques. critères, permettant une organisation et une visualisation efficaces des données.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!