pandas实战指南：快速删除行数据的技巧-Python教程-PHP中文网

pandas实战指南：快速删除行数据的技巧

王林

发布： 2024-01-10 09:09:42

原创

798 人浏览过

pandas实战指南：快速删除行数据的技巧

概述：
Pandas是Python中一个常用的数据分析库，具有强大的数据处理和操作功能。在数据处理过程中，经常需要删除不需要的行数据，本文将介绍一些使用pandas删除行数据的技巧，并提供具体的代码示例。

一、删除特定条件的行数据

删除某个特定值的行：
在pandas中，可以使用DataFrame的drop方法来删除特定值的行。首先，我们需要创建一个示例数据集：

import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'],
        'Age': [25, 30, 35, 40],
        'Gender': ['Female', 'Male', 'Male', 'Male']}

df = pd.DataFrame(data)

登录后复制

现在我们要删除Gender为Male的行，可以使用以下代码：

df = df.drop(df[df['Gender'] == 'Male'].index)

登录后复制

运行后，df中会删除Gender为Male的行数据。
代码解析：

df['Gender'] == 'Male' 是一个条件判断语句，返回一个布尔类型的Series对象，表示Gender列中值为Male的行；df['Gender'] == 'Male' 是一个条件判断语句，返回一个布尔类型的Series对象，表示Gender列中值为Male的行；
df[df['Gender'] == 'Male'].index 返回索引，即Gender为'Male'的行所在的索引位置；
df.drop() 方法可以根据索引删除行。

删除空值行：
有时候需要删除包含空值的行数据，例如：

import pandas as pd
import numpy as np

data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'],
        'Age': [25, 30, np.nan, 40],
        'Gender': ['Female', 'Male', 'Male', 'Male']}
df = pd.DataFrame(data)

登录后复制

我们可以使用dropna()方法删除包含空值的行：

df = df.dropna()

登录后复制

运行后，df将删除包含空值的行数据。

删除重复行：
若数据集中包含重复的行，我们可以使用drop_duplicates()方法删除重复行数据：

import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Bob', 'David'],
        'Age': [25, 30, 30, 40],
        'Gender': ['Female', 'Male', 'Male', 'Male']}
df = pd.DataFrame(data)

登录后复制

现在我们可以使用以下代码删除重复行：

df = df.drop_duplicates()

登录后复制

二、根据行索引删除行
有时我们需要根据行索引进行删除，可以使用drop()

df[df['Gender'] == 'Male'].index 返回索引，即Gender为'Male'的行所在的索引位置；

df.drop() 方法可以根据索引删除行。

有时候需要删除包含空值的行数据，例如：

import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'],
        'Age': [25, 30, 35, 40],
        'Gender': ['Female', 'Male', 'Male', 'Male']}

df = pd.DataFrame(data)

登录后复制

我们可以使用dropna()方法删除包含空值的行：

df = df.drop(2)

登录后复制

运行后，df将删除包含空值的行数据。

删除重复行：

drop_duplicates()

import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'],
        'Age': [25, 30, 35, 40],
        'Gender': ['Female', 'Male', 'Male', 'Male']}

df = pd.DataFrame(data)

登录后复制