使用 df.to_dict() 轻松共享数据样本
尽管针对好问题有明确的指导方针并包含可重现的数据样本,但许多用户常常忽略提供足够的数据进行分析。本文探讨了使用 df.to_dict() 函数作为共享比随机数更复杂的样本数据帧的实用方法。
案例 1:来自本地源的数据帧
对于从本地来源获取的数据帧,这种方法很简单:
案例 2:其他表应用程序
如果您的表格位于Excel等应用程序中,您可以使用以下步骤:
处理更大的 Dataframe
对于较大的数据框,请考虑以下事项方法:
使用 Iris 的示例数据集
考虑 iris 数据集,该数据集以在plotly express 中可用而闻名。
import plotly.express as px import pandas as pd df = px.data.iris().head(10) sample = df.to_dict('split')
这将生成一个包含索引、列和数据键的字典,可以轻松重新创建数据框的使用:
df = pd.DataFrame(index=sample['index'], columns=sample['columns'], data=sample['data'])
编辑
请注意,df.to_dict() 在没有显式包含必要的导入(例如 from pandas import Timestamp)的情况下无法读取时间戳。
以上是如何轻松共享复杂的数据帧以实现可重现的代码示例?的详细内容。更多信息请关注PHP中文网其他相关文章!