Pandas-Praxisleitfaden: Tipps zum schnellen Löschen von Datenzeilen
Übersicht:
Pandas ist eine häufig verwendete Datenanalysebibliothek in Python mit leistungsstarken Datenverarbeitungs- und Manipulationsfunktionen. Während der Datenverarbeitung ist es häufig erforderlich, unnötige Zeilendaten zu löschen. In diesem Artikel werden einige Techniken zum Löschen von Zeilendaten mithilfe von Pandas vorgestellt und spezifische Codebeispiele bereitgestellt.
1. Zeilendaten unter bestimmten Bedingungen löschen
import pandas as pd data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'], 'Age': [25, 30, 35, 40], 'Gender': ['Female', 'Male', 'Male', 'Male']} df = pd.DataFrame(data)
Jetzt wollen wir die Zeilen mit Geschlecht als männlich löschen. Sie können den folgenden Code verwenden:
df = df.drop(df[df['Gender'] == 'Male'].index)
Nach dem Ausführen werden die Zeilendaten mit Geschlecht als männlich gelöscht aus dem df.
Code-Analyse:
df['Gender'] == 'Male'
ist eine bedingte Beurteilungsanweisung, die ein boolesches Reihenobjekt zurückgibt, das die Zeile mit dem Wert „Männlich“ in der Spalte „Geschlecht“ darstellt; df['Gender'] == 'Male'
是一个条件判断语句,返回一个布尔类型的Series对象,表示Gender列中值为Male的行;df[df['Gender'] == 'Male'].index
返回索引,即Gender为'Male'的行所在的索引位置;df.drop()
方法可以根据索引删除行。import pandas as pd import numpy as np data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'], 'Age': [25, 30, np.nan, 40], 'Gender': ['Female', 'Male', 'Male', 'Male']} df = pd.DataFrame(data)
我们可以使用dropna()
方法删除包含空值的行:
df = df.dropna()
运行后,df将删除包含空值的行数据。
drop_duplicates()
方法删除重复行数据:import pandas as pd data = {'Name': ['Alice', 'Bob', 'Bob', 'David'], 'Age': [25, 30, 30, 40], 'Gender': ['Female', 'Male', 'Male', 'Male']} df = pd.DataFrame(data)
现在我们可以使用以下代码删除重复行:
df = df.drop_duplicates()
二、根据行索引删除行
有时我们需要根据行索引进行删除,可以使用drop()
df[df['Gender'] == 'Male'].index
Gibt den Index zurück, also die Indexposition der Zeile, deren Geschlecht 'Male' ist; Die Methode .drop() kann Zeilen basierend auf dem Index löschen.
Zeilen mit Nullwerten löschen:
Manchmal ist es notwendig, Zeilendaten zu löschen, die Nullwerte enthalten, zum Beispiel:import pandas as pd data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'], 'Age': [25, 30, 35, 40], 'Gender': ['Female', 'Male', 'Male', 'Male']} df = pd.DataFrame(data)
Wir können dropna()< verwenden /code> Methode zum Löschen von Zeilen mit Nullwerten: <br><div class="code" style="position:relative; padding:0px; margin:0px;"><pre class='brush:python;toolbar:false;'>df = df.drop(2)</pre><div class="contentsignin">Nach dem Login kopieren</div></div></p>Nach der Ausführung löscht df Zeilendaten mit Nullwerten. <p><ol start="3"></p>Duplikate Zeilen löschen: <p>Wenn der Datensatz doppelte Zeilen enthält, können wir die Methode <code>drop_duplicates()
verwenden, um doppelte Zeilendaten zu löschen:
import pandas as pd data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'], 'Age': [25, 30, 35, 40], 'Gender': ['Female', 'Male', 'Male', 'Male']} df = pd.DataFrame(data)
df = df.drop([1, 2])
drop()
verwenden, um Zeilendaten zu löschen basierend auf dem Index. 🎜df = df.drop(df.index[1:4])
Das obige ist der detaillierte Inhalt vonPraktischer Pandas-Leitfaden: Tipps zum schnellen Löschen von Zeilendaten. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!