首页 > 后端开发 > Python教程 > 如何使用间隔索引连接具有重叠日期时间范围的数据帧?

如何使用间隔索引连接具有重叠日期时间范围的数据帧?

Barbara Streisand
发布: 2024-12-15 16:16:15
原创
111 人浏览过

How to Join DataFrames with Overlapping Datetime Ranges Using Interval Indexing?

使用区间索引连接具有重叠范围的数据帧

给定两个数据帧 df_1 和 df_2,具有表示日期时间范围的公共列,我们的目标是使用特定条件加入它们:df_1 的日期时间列值必须落在 df_2 中指定的范围内。

df_1

  timestamp              A          B
0 2016-05-14 10:54:33    0.020228   0.026572
1 2016-05-14 10:54:34    0.057780   0.175499
2 2016-05-14 10:54:35    0.098808   0.620986
3 2016-05-14 10:54:36    0.158789   1.014819
4 2016-05-14 10:54:39    0.038129   2.384590


df_2

  start                end                  event    
0 2016-05-14 10:54:31  2016-05-14 10:54:33  E1
1 2016-05-14 10:54:34  2016-05-14 10:54:37  E2
2 2016-05-14 10:54:38  2016-05-14 10:54:42  E3
登录后复制

解决方案:

我们可以使用区间索引来实现这一点。间隔索引根据 df_2 中指定的范围创建 bin,并将标签分配给 df_1 中属于这些 bin 的时间戳。

import pandas as pd

# Convert start and end columns to IntervalIndex
df_2.index = pd.IntervalIndex.from_arrays(df_2['start'], df_2['end'], closed='both')

# Get the event associated with each timestamp in df_1
df_1['event'] = df_1['timestamp'].apply(lambda x: df_2.iloc[df_2.index.get_loc(x)]['event'])
登录后复制

输出:

            timestamp         A         B event
0 2016-05-14 10:54:33  0.020228  0.026572    E1
1 2016-05-14 10:54:34  0.057780  0.175499    E2
2 2016-05-14 10:54:35  0.098808  0.620986    E2
3 2016-05-14 10:54:36  0.158789  1.014819    E2
4 2016-05-14 10:54:39  0.038129  2.384590    E3
登录后复制

以上是如何使用间隔索引连接具有重叠日期时间范围的数据帧?的详细内容。更多信息请关注PHP中文网其他相关文章!

来源:php.cn
本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
作者最新文章
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板