如何将 Pandas 字典列拆分为单独的列
在 Pandas DataFrame 中,可能会遇到包含字典的列。要将这些字典中的值提取到单独的列中,json_normalize 函数是一个有效的解决方案。
以下代码演示了该过程:
这将创建一个新的 DataFrame df2,其中包含“污染物水平”字典列中的值分为单独的列。
处理不同的长度列表:
所提供的要求指定字典中的所有列表包含相同的三个键('a'、'b'、'c'),但长度不一定相同。为了适应这种情况,代码使用 json_normalize,它通过用 NaN 填充缺失值来自动处理变量列表长度。
Unicode 问题解决方案:
如果字典值是采用 Unicode 格式(u{'a': '1', 'b': '2', 'c': '3'} 而不是{u'a': '1', u'b': '2', u'c': '3'}),代码仍然可以正确运行。 json_normalize 可以处理两种类型的 Unicode 字符串。
Unicode 示例:
对于以 Unicode 格式从 PostgreSQL 数据库导入的数据:
这会将 Unicode 字符串转换为常规字符串,然后将字典列拆分为单独的列。
以上是如何有效地将 Pandas 字典列拆分为单独的列?的详细内容。更多信息请关注PHP中文网其他相关文章!