Dans l'analyse des données, la transposition d'une dataframe est cruciale pour organiser les données dans un format plus approprié. Un cas d'utilisation courant consiste à faire pivoter un dataframe en fonction de valeurs de colonne spécifiques.
Pour un tableau CSV contenant des données comme suit :
Indicator Country Year Value 1 Angola 2005 6 2 Angola 2005 13 3 Angola 2005 10 4 Angola 2005 11 5 Angola 2005 5 1 Angola 2006 3 2 Angola 2006 2 3 Angola 2006 7 4 Angola 2006 3 5 Angola 2006 6
vous pouvez faire pivoter le dataframe pour obtenir ce format :
Country Year 1 2 3 4 5 Angola 2005 6 13 10 11 5 Angola 2006 3 2 7 3 6
Pour réaliser cette transformation, vous pouvez utiliser la méthode .pivot comme suit :
out = df.pivot(index=['Country', 'Year'], columns='Indicator', values='Value') print(out)
Pour les données avec duplicata combinaisons d'étiquettes, vous pouvez utiliser la méthode .pivot_table, qui applique le calcul de la moyenne par défaut :
out = df.pivot_table( index=['Country', 'Year'], columns='Indicator', values='Value') print(out.rename_axis(columns=None).reset_index())
En utilisant les méthodes .rename_axis et .reset_index, vous pouvez restaurer la trame de données dans un format de tableau plat.
Référez-vous au guide de l'utilisateur Pandas pour une documentation détaillée sur le remodelage et les tableaux croisés dynamiques.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!