首頁 > 後端開發 > Python教學 > 如何輕鬆共享複雜的資料幀以實現可重現的程式碼範例?

如何輕鬆共享複雜的資料幀以實現可重現的程式碼範例?

Barbara Streisand
發布: 2024-12-22 14:44:10
原創
783 人瀏覽過

How Can I Easily Share Complex DataFrames for Reproducible Code Examples?

使用df.to_dict() 輕鬆共享資料樣本

儘管針對好問題有明確的指導方針並包含可重現的資料樣本,但許多使用者常常忽略提供足夠的數據進行分析。本文探討了使用 df.to_dict() 函數作為共享比隨機數更複雜的樣本資料幀的實用方法。

案例1:來自本地來源的資料幀

對於從本地來源取得的資料幀,這種方法很簡單:

  1. 執行df.to_dict() 產生資料幀的字典表示。
  2. 複製輸出,包括字典結構。
  3. 將內容貼到 pd.DataFrame() 中程式碼片段。

案例2:其他表格應用程式

如果您的表格位於Excel等應用程式中,您可以使用以下步驟:

  1. 複製表格內容。
  2. 執行df =pd.read_clipboard(sep='s ') 將內容讀入資料幀,其中s ' 表示任意space.
  3. 執行df.to_dict() 並將結果包含在df=pd.DataFrame() 中。

處理更大的Dataframe

對於較大的資料框,請考慮以下事項方法:

  • 使用df .head(20).to_dict() 僅包含前20 行。
  • 使用 df.to_dict('split') 重塑輸出提高了更少行數的可讀性。

使用 Iris 的範例資料集

考慮 iris 資料集,該資料集以在plotly express 中可用而聞名。

import plotly.express as px
import pandas as pd

df = px.data.iris().head(10)
sample = df.to_dict('split')
登入後複製

這將產生一個包含索引、列和資料鍵的字典,可以輕鬆重新建立資料框的使用:

df = pd.DataFrame(index=sample['index'], columns=sample['columns'], data=sample['data'])
登入後複製

編輯

請注意,df.to_dict() 在沒有明確包含必要的導入(例如from pandas import Timestamp)的情況下無法讀取時間戳記。

以上是如何輕鬆共享複雜的資料幀以實現可重現的程式碼範例?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
作者最新文章
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板