場景:
Pandas DataFrame 中的資料通常以各種格式存在,包括字串。使用時態資料時,時間戳記最初可能顯示為字串,但需要轉換為日期時間格式以進行準確分析。
基於日期的轉換和過濾
至使用 to_datetime 函數將 Pandas 中的字串列轉換為日期時間。此函數採用格式參數來指定字串列的預期格式。
範例:
考慮以下 DataFrame,其欄位 (Mycol)中包含字串自訂格式:
import pandas as pd raw_data = pd.DataFrame({'Mycol': ['05SEP2014:00:00:00.000']})
要將此列轉換為日期時間,請使用以下命令code:
df['Mycol'] = pd.to_datetime(df['Mycol'], format='%d%b%Y:%H:%M:%S.%f')
指定的格式參數與給定的字符串格式匹配。轉換後,Mycol 列現在將包含日期時間物件。
基於日期的過濾
列轉換為日期時間後,您可以執行基於日期的過濾操作。例如,要選擇日期在特定範圍內的行:
start_date = '01SEP2014' end_date = '30SEP2014' filtered_df = df[(df['Mycol'] >= pd.to_datetime(start_date)) & (df['Mycol'] <= pd.to_datetime(end_date))]
產生的filtered_df將僅包含Mycol列值在指定日期之間的行。
以上是如何將 Pandas DataFrame 列轉換為日期時間格式並按日期過濾?的詳細內容。更多資訊請關注PHP中文網其他相關文章!