在这种情况下,您希望从层次结构由以下内容组成的嵌套字典创建 pandas DataFrame :
所需的 DataFrame 应该以用户 ID 作为索引,以类别和属性作为列。
一种有效的方法利用 pandas MultiIndex,可以创建多级索引结构。要使用此方法:
user_dict = {12: {'Category 1': {'att_1': 1, 'att_2': 'whatever'}, 'Category 2': {'att_1': 23, 'att_2': 'another'}}, 15: {'Category 1': {'att_1': 10, 'att_2': 'foo'}, 'Category 2': {'att_1': 30, 'att_2': 'bar'}}} df = pd.DataFrame.from_dict({(i,j): user_dict[i][j] for i in user_dict.keys() for j in user_dict[i].keys()}, orient='index') print(df) att_1 att_2 12 Category 1 1 whatever Category 2 23 another 15 Category 1 10 foo Category 2 30 bar
或者,您可以通过串联逐步构建 DataFrame:
user_ids = [] frames = [] for user_id, d in user_dict.iteritems(): user_ids.append(user_id) frames.append(pd.DataFrame.from_dict(d, orient='index')) df = pd.concat(frames, keys=user_ids) print(df) att_1 att_2 12 Category 1 1 whatever Category 2 23 another 15 Category 1 10 foo Category 2 30 bar
以上是如何从具有分层索引的嵌套字典创建 Pandas DataFrame?的详细内容。更多信息请关注PHP中文网其他相关文章!