Panduan Praktikal Pandas: Petua untuk memadamkan baris data dengan cepat
Ikhtisar:
Pandas ialah perpustakaan analisis data yang biasa digunakan dalam Python, dengan pemprosesan data yang berkuasa dan fungsi manipulasi. Semasa pemprosesan data, selalunya perlu memadamkan data baris yang tidak diperlukan Artikel ini akan memperkenalkan beberapa teknik untuk memadam data baris menggunakan panda dan memberikan contoh kod tertentu.
1. Padamkan data baris dalam keadaan tertentu
import pandas as pd data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'], 'Age': [25, 30, 35, 40], 'Gender': ['Female', 'Male', 'Male', 'Male']} df = pd.DataFrame(data)
Sekarang kami ingin memadamkan baris dengan Jantina sebagai Lelaki, anda boleh menggunakan kod berikut:
df = df.drop(df[df['Gender'] == 'Male'].index)
Selepas dijalankan, data baris dengan Jantina sebagai Lelaki akan dipadamkan daripada df.
Analisis kod:
df['Gender'] == 'Male'
是一个条件判断语句,返回一个布尔类型的Series对象,表示Gender列中值为Male的行;df[df['Gender'] == 'Male'].index
返回索引,即Gender为'Male'的行所在的索引位置;df.drop()
方法可以根据索引删除行。import pandas as pd import numpy as np data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'], 'Age': [25, 30, np.nan, 40], 'Gender': ['Female', 'Male', 'Male', 'Male']} df = pd.DataFrame(data)
我们可以使用dropna()
方法删除包含空值的行:
df = df.dropna()
运行后,df将删除包含空值的行数据。
drop_duplicates()
方法删除重复行数据:import pandas as pd data = {'Name': ['Alice', 'Bob', 'Bob', 'David'], 'Age': [25, 30, 30, 40], 'Gender': ['Female', 'Male', 'Male', 'Male']} df = pd.DataFrame(data)
现在我们可以使用以下代码删除重复行:
df = df.drop_duplicates()
二、根据行索引删除行
有时我们需要根据行索引进行删除,可以使用drop()
Kadangkala perlu memadamkan data baris yang mengandungi nilai nol, contohnya:
import pandas as pd data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'], 'Age': [25, 30, 35, 40], 'Gender': ['Female', 'Male', 'Male', 'Male']} df = pd.DataFrame(data)
Kita boleh menggunakan dropna()< /code> Kaedah untuk memadam baris yang mengandungi nilai nol: </p><div class="code" style="position:relative; padding:0px; margin:0px;"><pre class='brush:python;toolbar:false;'>df = df.drop(2)</pre><div class="contentsignin">Salin selepas log masuk</div></div><p>Selepas dijalankan, df akan memadamkan data baris yang mengandungi nilai nol. </p><ol start="3"><p>Padamkan baris pendua: </p>Jika set data mengandungi baris pendua, kami boleh menggunakan kaedah <code>drop_duplicates()
untuk memadamkan data baris pendua:
import pandas as pd data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'], 'Age': [25, 30, 35, 40], 'Gender': ['Female', 'Male', 'Male', 'Male']} df = pd.DataFrame(data)
df = df.drop([1, 2])
drop()
untuk memadam data baris berdasarkan indeks. 🎜df = df.drop(df.index[1:4])
Atas ialah kandungan terperinci Panduan praktikal Pandas: Petua untuk memadamkan data baris dengan cepat. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!