使用 Pandas 擴充 CSV 檔案
處理大型資料集時,可能需要將資料新增至現有 CSV 檔案。 Pandas 是 Python 中強大的資料操作庫,提供 to_csv() 函數用於將資料匯出為 CSV 格式。本文探討如何使用 to_csv() 將資料附加到現有 CSV 文件,確保與其結構相容。
附加到現有 CSV 檔案
to_csv( ) 函數提供了一個寫入模式參數,允許使用者指定如何將資料寫入檔案。透過將此參數設為“a”,資料將附加到現有文件中。例如:
df.to_csv('my_csv.csv', mode='a', header=False)
這裡,資料幀 df 被附加到名為「my_csv.csv」的 CSV 檔案中。 header=False 參數確保標題行不會被多次寫入。
要注意的是,to_csv() 的預設寫入模式是 'w',它會覆寫現有檔案。為了確保追加模式,請明確指定 'a'。
處理初始檔案不存在
如果目標 CSV 檔案原本不存在,則標題行可能不存在如果使用附加模式,則寫入正確。為了解決這個問題,您可以使用以下變體:
import os output_path='my_csv.csv' df.to_csv(output_path, mode='a', header=not os.path.exists(output_path))
此程式碼使用 os.path.exists() 檢查檔案是否存在。如果沒有,它會透過設定 header=True 來寫入標題行。否則,它會附加不帶標題的資料。
以上是如何使用 Pandas 將資料附加到現有 CSV 檔案?的詳細內容。更多資訊請關注PHP中文網其他相關文章!