首頁 > 後端開發 > Python教學 > 如何依時間戳範圍加入 Pandas DataFrame?

如何依時間戳範圍加入 Pandas DataFrame?

Barbara Streisand
發布: 2024-12-09 00:16:11
原創
795 人瀏覽過

How to Join Pandas DataFrames Based on Timestamp Ranges?

根據值範圍連接資料幀

給定兩個資料幀df_1 和df_2,可以將它們連接起來,以便日期時間列時間戳in df_1 落在由start 和end in列定義的指定範圍內df_2.

要完成此任務,一種方法是從開始列和結束列建立區間索引,將關閉選項設為兩者以確保包含邊界。使用這個區間索引,我們可以利用 get_loc 來取得 df_1 中每個時間戳對應的事件。

範例:

import pandas as pd

# Input dataframes
df_1 = pd.DataFrame({
    'timestamp': ['2016-05-14 10:54:33', '2016-05-14 10:54:34', '2016-05-14 10:54:35', '2016-05-14 10:54:36', '2016-05-14 10:54:39'],
    'A': [0.020228, 0.057780, 0.098808, 0.158789, 0.038129],
    'B': [0.026572, 0.175499, 0.620986, 1.014819, 2.384590]
})

df_2 = pd.DataFrame({
    'start': ['2016-05-14 10:54:31', '2016-05-14 10:54:34', '2016-05-14 10:54:38'],
    'end': ['2016-05-14 10:54:33', '2016-05-14 10:54:37', '2016-05-14 10:54:42'],
    'event': ['E1', 'E2', 'E3']
})

# Create interval index
df_2.index = pd.IntervalIndex.from_arrays(df_2['start'], df_2['end'], closed='both')

# Join dataframes using get_loc
df_1['event'] = df_1['timestamp'].apply(lambda x: df_2.iloc[df_2.index.get_loc(x)]['event'])

# Output joined dataframe
print(df_1)
登入後複製

輸出:

            timestamp         A         B event
0 2016-05-14 10:54:33  0.020228  0.026572    E1
1 2016-05-14 10:54:34  0.057780  0.175499    E2
2 2016-05-14 10:54:35  0.098808  0.620986    E2
3 2016-05-14 10:54:36  0.158789  1.014819    E2
4 2016-05-14 10:54:39  0.038129  2.384590    E3
登入後複製

以上是如何依時間戳範圍加入 Pandas DataFrame?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

來源:php.cn
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
作者最新文章
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板