场景:
Pandas DataFrame 中的数据通常以各种格式存在,包括字符串。使用时态数据时,时间戳最初可能显示为字符串,但需要转换为日期时间格式以进行准确分析。
基于日期的转换和过滤
至使用 to_datetime 函数将 Pandas 中的字符串列转换为日期时间。此函数采用格式参数来指定字符串列的预期格式。
示例:
考虑以下 DataFrame,其列 (Mycol) 中包含字符串自定义格式:
import pandas as pd raw_data = pd.DataFrame({'Mycol': ['05SEP2014:00:00:00.000']})
要将此列转换为日期时间,请使用以下命令code:
df['Mycol'] = pd.to_datetime(df['Mycol'], format='%d%b%Y:%H:%M:%S.%f')
指定的格式参数与给定的字符串格式匹配。转换后,Mycol 列现在将包含日期时间对象。
基于日期的过滤
列转换为日期时间后,您可以执行基于日期的过滤操作。例如,要选择日期在特定范围内的行:
start_date = '01SEP2014' end_date = '30SEP2014' filtered_df = df[(df['Mycol'] >= pd.to_datetime(start_date)) & (df['Mycol'] <= pd.to_datetime(end_date))]
生成的filtered_df将仅包含Mycol列值在指定日期之间的行。
以上是如何将 Pandas DataFrame 列转换为日期时间格式并按日期过滤?的详细内容。更多信息请关注PHP中文网其他相关文章!