使用Pandas 組合日期和時間列
處理時態資料時,通常需要組合日期和時間列以獲得單一日期和時間列時間戳值。 Pandas 提供了各種選項來實現此目的,包括 pd.to_datetime() 函數。
連接字串和使用 pd.to_datetime()
在某些情況下,您的日期時間列儲存為字串。要組合它們,您只需用空格將它們連接起來,如下所示:
連接字串後,您可以使用pd.to_datetime() 將它們轉換為DatetimeIndex 物件:
此方法可讓您利用連接字串的推斷格式,該格式通常是各個列的日期和時間格式的組合。
使用format= 參數
但是,如果您的日期和時間字串不是標準化格式,或者如果您想明確指定格式,則可以使用format=參數,如下所示:
在這裡,您指定連接字串的確切格式,確保準確轉換。
直接解析日期
作為連接字串的替代方法,您也可以解析直接使用 pd.read_csv() 和 parse_dates 參數取得日期和時間資訊。此參數可讓您指定要解析為日期時間物件的資料列的清單。
例如,如果您的資料儲存在名為「data.csv」的CSV 檔案中:
在這種情況下,Pandas 會自動將指定的欄位解析為DatetimeIndex。
效能注意事項
處理大型資料集時,效能變得至關重要。連接字串然後將其轉換為日期時間比直接解析日期和時間資訊花費的時間要長得多。使用 %timeit 魔法指令的計時結果如下所示:
結果顯示直接解析速度明顯較快,尤其是大型資料集。
以上是如何組合 Pandas 中的日期和時間列?的詳細內容。更多資訊請關注PHP中文網其他相關文章!