将 Pandas 中的日期和时间列与 pd.to_datetime() 组合
在 Pandas 中处理日期和时间数据时,通常有必要将单独的列组合成单个日期时间对象。一种方法是使用 pd.to_datetime() 函数。
问题陈述
考虑一个包含“日期”和“时间”列的数据框,如下所示如下所示:
Date Time 01-06-2013 23:00:00 02-06-2013 01:00:00 02-06-2013 21:00:00 02-06-2013 22:00:00 02-06-2013 23:00:00 03-06-2013 01:00:00 03-06-2013 21:00:00 03-06-2013 22:00:00 03-06-2013 23:00:00 04-06-2013 01:00:00
我们的目标是将这两列合并为一个“日期和”
使用字符串连接的解决方案
一种方法是将“日期”和“时间”列连接为字符串,然后将结果字符串转换为使用 pd.to_datetime() 的 datetime 对象:
result = pd.to_datetime(df['Date'] + ' ' + df['Time'])
这会将连接的字符串转换为一系列日期时间对象。
解决方案使用 format 参数
或者,您可以使用 pd.to_datetime() 的 format 参数来指定组合的确切格式string:
result = pd.to_datetime(df['Date'] + df['Time'], format='%m-%d-%Y %H:%M:%S')
这种方法比前一种方法更快,特别是在处理大型数据时
性能比较
使用 %%timeit 魔法命令,我们可以比较两种方法的性能:
df = pd.concat([df for _ in range(1000000)]).reset_index(drop=True) %timeit pd.to_datetime(df['Date'] + ' ' + df['Time']) %timeit pd.to_datetime(df['Date'] + df['Time'], format='%m-%d-%Y %H:%M:%S')
第二种对于大型数据集,使用格式参数的方法明显更快。
以上是如何使用 pd.to_datetime() 有效组合 Pandas 中的日期和时间列?的详细内容。更多信息请关注PHP中文网其他相关文章!