比較兩個資料幀以識別差異
要比較兩個資料幀df1 和df2,並確定它們之間的差異,可以執行以下步驟採取:
由於提供的程式碼df1 != df2 僅適用於具有相同行和列的資料幀,因此需要一種替代方法。將兩個資料幀連接成一個資料幀 df,可以進行更徹底的比較。
<code class="python">import pandas as pd df = pd.concat([df1, df2])</code>
連接後,重設 df 的索引以避免潛在的索引衝突。
<code class="python">df = df.reset_index(drop=True)</code>
以每一列將資料框分組,以識別唯一記錄。
<code class="python">df_gpby = df.groupby(list(df.columns))</code>
提取唯一記錄的索引,其中組的長度為 1。
<code class="python">idx = [x[0] for x in df_gpby.groups.values() if len(x) == 1]</code>
基於過濾資料框在唯一索引上取得 df1 和 df2 之間的差異。
<code class="python">result = df.reindex(idx)</code>
產生的結果資料幀將包含 df2 中但不包含 df1 中的行。
以上是如何辨識 Python 中兩個 Dataframe 之間的差異?的詳細內容。更多資訊請關注PHP中文網其他相關文章!