根据列值范围连接 DataFrame
在给定的上下文中,我们有两个数据帧 df_1 和 df_2,我们需要在其中合并它们使得 df_1 中的时间戳列落在中的开始列和结束列内df_2.
实现此目的的一种方法是从 df_2 中的开始列和结束列创建区间索引。然后我们可以使用 get_loc 方法获取 df_1 中每个时间戳对应的事件。以下是此解决方案的 Python 代码:
# Create interval index from df_2 df_2.index = pd.IntervalIndex.from_arrays(df_2['start'], df_2['end'], closed='both') # Get corresponding event for each timestamp in df_1 df_1['event'] = df_1['timestamp'].apply(lambda x: df_2.iloc[df_2.index.get_loc(x)]['event'])
这将在 df_1 中创建一个名为 event 的新列,其中包含 df_2 中指定范围内的每个时间戳的相应事件。生成的连接数据框将包含以下列:
timestamp A B event
输出将类似于:
timestamp A B event 0 2016-05-14 10:54:33 0.020228 0.026572 E1 1 2016-05-14 10:54:34 0.057780 0.175499 E2 2 2016-05-14 10:54:35 0.098808 0.620986 E2 3 2016-05-14 10:54:36 0.158789 1.014819 E2 4 2016-05-14 10:54:39 0.038129 2.384590 E3
以上是如何根据时间戳范围连接DataFrame?的详细内容。更多信息请关注PHP中文网其他相关文章!