Membandingkan Dua Bingkai Data untuk Mengenalpasti Perbezaan
Untuk membandingkan dua bingkai data, df1 dan df2, dan menentukan perbezaan antara mereka, langkah berikut boleh diambil:
Memandangkan kod yang disediakan df1 != df2 hanya terpakai untuk bingkai data dengan baris dan lajur yang sama, pendekatan alternatif diperlukan. Menggabungkan dua bingkai data menjadi satu bingkai data, df, akan membolehkan perbandingan yang lebih teliti.
<code class="python">import pandas as pd df = pd.concat([df1, df2])</code>
Setelah digabungkan, tetapkan semula indeks df untuk mengelakkan kemungkinan konflik indeks.
<code class="python">df = df.reset_index(drop=True)</code>
Kumpulkan bingkai data mengikut setiap lajur untuk mengenal pasti rekod unik.
<code class="python">df_gpby = df.groupby(list(df.columns))</code>
Ekstrak indeks rekod unik, dengan panjang kumpulan ialah 1.
<code class="python">idx = [x[0] for x in df_gpby.groups.values() if len(x) == 1]</code>
Tapis berdasarkan kerangka data pada indeks unik untuk mendapatkan perbezaan antara df1 dan df2.
<code class="python">result = df.reindex(idx)</code>
Kerangka data hasil yang terhasil akan mengandungi baris yang berada dalam df2 tetapi bukan dalam df1.
Atas ialah kandungan terperinci Bagaimana untuk Mengenalpasti Perbezaan Antara Dua Bingkai Data dalam Python?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!