使用不同长度的数组从字典创建 Dataframe
所面临的挑战是生成一个包含由不同长度的 numpy 数组组成的列的数据框从字典中提取的值。为了实现这一目标,让我们探索使用 Python 的解决方案。
在 Python 3.x 及更高版本中,可以使用以下代码片段:
import pandas as pd import numpy as np # Define a dictionary with key-value pairs representing numpy arrays d = { "A": np.random.randn(10), "B": np.random.randn(12), "C": np.random.randn(8) } # Create a dataframe by converting each key-value pair to a series df = pd.DataFrame( dict([ (k, pd.Series(v)) for k, v in d.items() ]) ) # Display the resulting dataframe print(df)
此代码创建一个包含列“的数据框” A、”、“B”和“C”,每个都保存字典中相应的 numpy 数组值。如果数组的长度不同,它会自动对齐它们,并使用 NaN 值作为填充来扩展较短的数组。
在 Python 2.x 中,需要进行少量修改:
import pandas as pd import numpy as np # Define a dictionary with key-value pairs representing numpy arrays d = { "A": np.random.randn(10), "B": np.random.randn(12), "C": np.random.randn(8) } # Create a dataframe by converting each key-value pair to a series df = pd.DataFrame( dict([ (k, pd.Series(v)) for k, v in d.iteritems() ]) ) # Display the resulting dataframe print(df)
在 Python 中2.x 中,使用 iteritems() 函数代替 items() 来迭代字典中的键值对。
通过利用这种方法,您可以方便地创建包含不同长度数组的列的数据框,确保数据正确对齐和处理。
以上是如何从具有不同长度数组的字典创建 Pandas 数据框?的详细内容。更多信息请关注PHP中文网其他相关文章!