Construction d'un DataFrame Pandas à partir de valeurs de dictionnaire imbriquées avec indexation hiérarchique
Considérez un dictionnaire imbriqué, user_dict, où les clés de premier niveau représentent les ID utilisateur, les clés de deuxième niveau sont des catégories et les clés de troisième niveau sont divers attributs. Le but est de construire un DataFrame pandas avec un index hiérarchique en utilisant les valeurs du troisième niveau.
Pour y parvenir, nous devons remodeler les clés du dictionnaire en tuples représentant l'index hiérarchique. En utilisant pd.DataFrame.from_dict, nous pouvons créer un DataFrame avec la structure d'index correcte :
user_dict = {12: {'Category 1': {'att_1': 1, 'att_2': 'whatever'}, 'Category 2': {'att_1': 23, 'att_2': 'another'}}, 15: {'Category 1': {'att_1': 10, 'att_2': 'foo'}, 'Category 2': {'att_1': 30, 'att_2': 'bar'}}} pd.DataFrame.from_dict({(i,j): user_dict[i][j] for i in user_dict.keys() for j in user_dict[i].keys()}, orient='index') att_1 att_2 12 Category 1 1 whatever Category 2 23 another 15 Category 1 10 foo Category 2 30 bar
Une approche alternative consiste à concaténer des DataFrames individuels créés à partir de chaque entrée du dictionnaire :
user_ids = [] frames = [] for user_id, d in user_dict.iteritems(): user_ids.append(user_id) frames.append(pd.DataFrame.from_dict(d, orient='index')) pd.concat(frames, keys=user_ids) att_1 att_2 12 Category 1 1 whatever Category 2 23 another 15 Category 1 10 foo Category 2 30 bar
Les deux Les méthodes construisent efficacement un DataFrame avec un index hiérarchique en utilisant les valeurs du troisième niveau du dictionnaire imbriqué.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!