データフレームのマージ: 抽出されたデータセットの結合
データ操作のコンテキストでは、複数のデータ フレームを結合することが一般的な要件です。特定のシナリオで、初期データフレーム D があり、特定の条件に基づいてそこから 2 つのサブセット A と B を抽出するとします。
A = D[D.label == k] B = D[D.label != k]
目標は、A と B を単一のデータフレームにマージして戻すことです。 。データの順序は重要ではありませんが、D から派生した A と B の元のインデックスを保持することが重要です。
解決策: Append メソッドを使用する
データ フレームを結合する 1 つのアプローチは、append メソッドを使用することです。この方法を使用すると、1 つ以上のデータ フレームを垂直方向に連結し、効果的に相互に積み重ねることができます。この例では、以下のコードを使用できます:
df_merged = df1.append(df2, ignore_index=True)
これにより、A と B から結合されたデータを含む df_merged という新しい DataFrame が作成されます。ignore_index=True 引数により、結果の DataFrame が元のインデックスとは独立した独自のインデックスのセット。
元のインデックスの保持
A と B の元のインデックスを保持したい場合は、ignore_index= を設定できます。 append メソッドで False:
df_merged = df1.append(df2, ignore_index=False)
これにより、マージされた結果内の各データ フレームのインデックス値が保持されます。ただし、最終的な DataFrame ではインデックスが重複する値になる可能性があることに注意することが重要です。
以上がPython でデータフレームをマージし、元のインデックスを保持する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。