重複する日時範囲のデータフレームの結合
2 つのデータフレーム df_1 と df_2 が与えられ、df_1 にはタイムスタンプ列があり、df_2 には開始と終了が含まれます。日時範囲を表す列の目的は、以下に基づいてデータフレームを結合することです。 df_1 のタイムスタンプ列が df_2 の開始列と終了列で定義された範囲内にあるという条件。
これを達成するには、1 つの効果的な解決策として、開始値と終了値に基づいて df_2 のインデックスを作成するために Pandas の IntervalIndex を利用します。 。 IntervalIndex で Closed='both' を設定することで、間隔のエンドポイントが確実に含まれるようになります。
次に、get_loc メソッドを利用して、df_1 内の指定されたタイムスタンプに対応する間隔を特定できます。このアプローチを使用すると、その時間範囲に関連付けられた df_2 から対応するイベントを取得できます。
このプロセスを df_1 の各行に適用することで、適切なイベント値を新しい列に割り当て、2 つの列を効果的に結合できます。
このソリューションは、重複する日時間隔に基づいてデータフレーム間の複雑な結合を実行するための簡単で効率的な方法を提供します。
以上が重複する日時範囲に基づいて DataFrame を効率的に結合するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。