Bagaimanakah Saya Mengekstrak Senarai Komprehensif Item Pendua Menggunakan Panda dalam Python?
Adalah mungkin untuk menghadapi situasi di mana set data mengandungi isu eksport yang berpotensi, mengakibatkan item pendua. Mengenal pasti pendua ini adalah penting untuk perbandingan manual selanjutnya. Walau bagaimanapun, kaedah pendua panda lalai hanya mengembalikan contoh pertama pendua.
Kaedah 1: Mencetak Semua Baris dengan ID Pendua
Menggunakan kaedah ini, anda boleh mengenal pasti dan cetak semua baris yang ID sepadan dengan mana-mana ID dalam siri pendua.
<code class="python">import pandas as pd df = pd.read_csv("dup.csv") ids = df["ID"] df[ids.isin(ids[ids.duplicated()])].sort_values("ID")</code>
Kaedah 2: Pengumpulan mengikut ID
Sebagai alternatif, anda boleh mengumpulkan bingkai data mengikut lajur ID dan gabungkan kumpulan dengan lebih daripada satu baris ke dalam bingkai data baharu.
<code class="python">pd.concat(g for _, g in df.groupby("ID") if len(g) > 1)</code>
Atas ialah kandungan terperinci Berikut ialah beberapa tajuk berasaskan soalan yang menangkap intipati artikel anda: **Pendek & Punchy:** * **Bagaimana untuk Mencari SEMUA Baris Pendua dalam Panda?** * **Mengekstrak Setiap Pendua dalam Data Pandas. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!