合併資料幀:組合擷取的資料集
在資料操作的上下文中,組合多個資料幀是一個常見的要求。在給定場景中,假設我們有一個初始 DataFrame D,並根據特定條件從中提取兩個子集 A 和 B:
A = D[D.label == k] B = D[D.label != k]
目標是將 A 和 B 合併回單一 DataFrame 。雖然資料的順序並不重要,但保留 A 和 B 的原始索引很重要,因為它們是從 D 派生的。
解決方案:使用 Append 方法
組合資料框的一種方法是使用append方法。這種方法允許我們垂直連接一個或多個資料幀,有效地將它們堆疊在一起。在我們的例子中,我們可以使用下面的程式碼:
df_merged = df1.append(df2, ignore_index=True)
這將建立一個名為 df_merged 的新 DataFrame,其中包含來自 A 和 B 的組合資料。 ignore_index=True 參數確保產生的 DataFrame 具有自己唯一的一組索引,與原始索引無關。
保留原始索引
如果我們想要保留A和B的原始索引,我們可以設定ignore_index=在append方法中為False:
df_merged = df1.append(df2, ignore_index=False)
這將保留合併結果中每個資料幀的索引值。但是,需要注意的是,索引可能會在最終的 DataFrame 中變成重複值。
以上是如何在 Python 中合併 DataFrame 並保留原始索引?的詳細內容。更多資訊請關注PHP中文網其他相關文章!