Panduan praktikal Pandas: Petua untuk memadamkan data baris dengan cepat

王林
Lepaskan: 2024-01-10 09:09:42
asal
673 orang telah melayarinya

Panduan praktikal Pandas: Petua untuk memadamkan data baris dengan cepat

Panduan Praktikal Pandas: Petua untuk memadamkan baris data dengan cepat

Ikhtisar:
Pandas ialah perpustakaan analisis data yang biasa digunakan dalam Python, dengan pemprosesan data yang berkuasa dan fungsi manipulasi. Semasa pemprosesan data, selalunya perlu memadamkan data baris yang tidak diperlukan Artikel ini akan memperkenalkan beberapa teknik untuk memadam data baris menggunakan panda dan memberikan contoh kod tertentu.

1. Padamkan data baris dalam keadaan tertentu

  1. Padam baris dengan nilai tertentu:
    Dalam panda, anda boleh menggunakan kaedah drop DataFrame untuk memadamkan baris dengan nilai tertentu. Mula-mula, kita perlu mencipta set data sampel:
import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'],
        'Age': [25, 30, 35, 40],
        'Gender': ['Female', 'Male', 'Male', 'Male']}

df = pd.DataFrame(data)
Salin selepas log masuk
Salin selepas log masuk
Salin selepas log masuk

Sekarang kami ingin memadamkan baris dengan Jantina sebagai Lelaki, anda boleh menggunakan kod berikut:

df = df.drop(df[df['Gender'] == 'Male'].index)
Salin selepas log masuk

Selepas dijalankan, data baris dengan Jantina sebagai Lelaki akan dipadamkan daripada df.
Analisis kod:

  • df['Jantina'] == 'Lelaki' ialah pernyataan penghakiman bersyarat yang mengembalikan objek Siri Boolean, mewakili baris dengan nilai Lelaki dalam lajur Jantina df['Gender'] == 'Male' 是一个条件判断语句,返回一个布尔类型的Series对象,表示Gender列中值为Male的行;
  • df[df['Gender'] == 'Male'].index 返回索引,即Gender为'Male'的行所在的索引位置;
  • df.drop() 方法可以根据索引删除行。
  1. 删除空值行:
    有时候需要删除包含空值的行数据,例如:
import pandas as pd
import numpy as np

data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'],
        'Age': [25, 30, np.nan, 40],
        'Gender': ['Female', 'Male', 'Male', 'Male']}
df = pd.DataFrame(data)
Salin selepas log masuk

我们可以使用dropna()方法删除包含空值的行:

df = df.dropna()
Salin selepas log masuk

运行后,df将删除包含空值的行数据。

  1. 删除重复行:
    若数据集中包含重复的行,我们可以使用drop_duplicates()方法删除重复行数据:
import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Bob', 'David'],
        'Age': [25, 30, 30, 40],
        'Gender': ['Female', 'Male', 'Male', 'Male']}
df = pd.DataFrame(data)
Salin selepas log masuk

现在我们可以使用以下代码删除重复行:

df = df.drop_duplicates()
Salin selepas log masuk

二、根据行索引删除行
有时我们需要根据行索引进行删除,可以使用drop()

df[df['Jantina'] == 'Lelaki'].index Mengembalikan indeks, iaitu kedudukan indeks baris yang Jantinanya ialah 'Lelaki'

df Kaedah .drop() boleh memadamkan baris berdasarkan indeks.

    Padamkan baris dengan nilai nol:

    Kadangkala perlu memadamkan data baris yang mengandungi nilai nol, contohnya:

    import pandas as pd
    
    data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'],
            'Age': [25, 30, 35, 40],
            'Gender': ['Female', 'Male', 'Male', 'Male']}
    
    df = pd.DataFrame(data)
    Salin selepas log masuk
    Salin selepas log masuk
    Salin selepas log masuk

    Kita boleh menggunakan dropna()< /code> Kaedah untuk memadam baris yang mengandungi nilai nol: </p><div class="code" style="position:relative; padding:0px; margin:0px;"><pre class='brush:python;toolbar:false;'>df = df.drop(2)</pre><div class="contentsignin">Salin selepas log masuk</div></div><p>Selepas dijalankan, df akan memadamkan data baris yang mengandungi nilai nol. </p><ol start="3"><p>Padamkan baris pendua: </p>Jika set data mengandungi baris pendua, kami boleh menggunakan kaedah <code>drop_duplicates() untuk memadamkan data baris pendua:


    import pandas as pd
    
    data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'],
            'Age': [25, 30, 35, 40],
            'Gender': ['Female', 'Male', 'Male', 'Male']}
    
    df = pd.DataFrame(data)
    Salin selepas log masuk
    Salin selepas log masuk
    Salin selepas log masuk

    Sekarang kami boleh menggunakan Kod berikut memadamkan baris pendua: 🎜
    df = df.drop([1, 2])
    Salin selepas log masuk
    🎜 2. Padamkan baris berdasarkan indeks baris 🎜 Kadangkala kita perlu memadam berdasarkan indeks baris Anda boleh menggunakan kaedah drop() untuk memadam data baris berdasarkan indeks. 🎜
    df = df.drop(df.index[1:4])
    Salin selepas log masuk
    🎜 Katakan kita ingin memadam baris dengan indeks 2, kita boleh menggunakan kod berikut: 🎜rrreee🎜Selepas dijalankan, baris dengan indeks 2 dipadamkan. 🎜🎜3. Padamkan berbilang baris🎜 Kadangkala anda perlu memadamkan berbilang baris, yang boleh dicapai dengan menghantar senarai diindeks atau menggunakan penghirisan. 🎜rrreee🎜Contoh 1: Padamkan baris dengan indeks 1 dan 2🎜rrreee🎜Contoh 2: Padam baris dengan indeks 1 hingga 3🎜rrreee🎜Kedua-dua kaedah di atas boleh memadam berbilang baris dengan cepat. 🎜🎜Kesimpulan: 🎜Artikel ini memperkenalkan teknik memadam data baris menggunakan panda dan menyediakan contoh kod khusus. Semasa pemprosesan data, menggunakan teknik ini boleh membantu kami memadamkan baris data yang tidak diperlukan dengan cepat dan cekap. Diharapkan pembaca dapat menggunakannya secara fleksibel dalam aplikasi praktikal untuk mempercepatkan kelajuan dan ketepatan pemprosesan data. 🎜

    Atas ialah kandungan terperinci Panduan praktikal Pandas: Petua untuk memadamkan data baris dengan cepat. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Label berkaitan:
sumber:php.cn
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan