首頁 > 後端開發 > Python教學 > 如何根據重疊的日期時間範圍有效地連接 DataFrame?

如何根據重疊的日期時間範圍有效地連接 DataFrame?

DDD
發布: 2024-12-31 07:10:14
原創
842 人瀏覽過

How Can I Efficiently Join DataFrames Based on Overlapping Datetime Ranges?

連接重疊日期時間範圍的資料幀

給定兩個資料幀df_1 和df_2,其中df_1 有一個時間戳列, df_2 有開始和結束表示日期時間範圍的列,目標是連接資料框基於df_1 中的時間戳記列落在df_2 中的開始列和結束列定義的範圍內的條件。

為了實現這一點,一個有效的解決方案是利用 Pandas 的 IntervalIndex 根據開始和結束欄位對 df_2 進行索引最終值。透過在 IntervalIndex 中設定 close='both',我們確保包含間隔的端點。

接下來,我們可以利用 get_loc 方法來辨識與 df_1 中給定時間戳記相對應的間隔。使用這種方法,我們可以從 df_2 中取得與該時間範圍相關的對應事件。

透過將此程序應用於 df_1 中的每一行,我們可以將適當的事件值分配給新列,從而有效地連接兩個列基於指定的日期時間範圍標準的資料幀。

此解決方案提供了一種簡單而有效的方法,用於根據重疊的日期時間在資料幀之間執行複雜的連接間隔。

以上是如何根據重疊的日期時間範圍有效地連接 DataFrame?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

來源:php.cn
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板