首页 > 后端开发 > Python教程 > 如何根据重叠的日期时间范围有效地连接 DataFrame?

如何根据重叠的日期时间范围有效地连接 DataFrame?

DDD
发布: 2024-12-31 07:10:14
原创
842 人浏览过

How Can I Efficiently Join DataFrames Based on Overlapping Datetime Ranges?

连接重叠日期时间范围的数据帧

给定两个数据帧 df_1 和 df_2,其中 df_1 有一个时间戳列,df_2 有开始和结束表示日期时间范围的列,目标是连接数据框基于 df_1 中的时间戳列落在 df_2 中的开始列和结束列定义的范围内的条件。

为了实现这一点,一种有效的解决方案是利用 Pandas 的 IntervalIndex 根据开始和结束列对 df_2 进行索引最终值。通过在 IntervalIndex 中设置 close='both',我们确保包含间隔的端点。

接下来,我们可以利用 get_loc 方法来识别与 df_1 中给定时间戳相对应的间隔。使用这种方法,我们可以从 df_2 中获取与该时间范围相关的相应事件。

通过将此过程应用于 df_1 中的每一行,我们可以将适当的事件值分配给新列,从而有效地连接两个列基于指定的日期时间范围标准的数据帧。

该解决方案提供了一种简单而有效的方法,用于根据重叠的日期时间在数据帧之间执行复杂的连接间隔。

以上是如何根据重叠的日期时间范围有效地连接 DataFrame?的详细内容。更多信息请关注PHP中文网其他相关文章!

来源:php.cn
本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板