Kenntnisse zur Datenverarbeitung: Detaillierte Erklärung zum Löschen von Zeilen in Pandas
Bei der Datenverarbeitung ist es häufig erforderlich, bestimmte Datenzeilen im DataFrame zu löschen. Pandas ist eine leistungsstarke Datenverarbeitungsbibliothek, die verschiedene Methoden zum Implementieren von Löschvorgängen für Zeilendaten bereitstellt. In diesem Artikel werden verschiedene gängige Methoden zum Löschen von Zeilen in Pandas ausführlich vorgestellt und spezifische Codebeispiele bereitgestellt.
import pandas as pd data = {'Name': ['Tom', 'Nick', 'John', 'David'], 'Age': [20, 25, 30, 35], 'Gender': ['M', 'M', 'M', 'M']} df = pd.DataFrame(data) # 删除索引为2的行数据 df = df.drop(2) print(df)
Die Ausgabe ist wie folgt:
Name Age Gender 0 Tom 20 M 1 Nick 25 M 3 David 35 M
Wie Sie sehen können, gibt die Drop-Methode einen neuen DataFrame zurück und löscht die angegebenen Zeilen im Ergebnis.
import pandas as pd data = {'Name': ['Tom', 'Nick', 'John', 'David'], 'Age': [20, 25, 30, 35], 'Gender': ['M', 'M', 'M', 'M']} df = pd.DataFrame(data) # 删除所有年龄小于30的行数据 df = df[df['Age'] >= 30] print(df)
Die Ausgabe lautet wie folgt:
Name Age Gender 2 John 30 M 3 David 35 M
Wie Sie sehen können, können wir durch Setzen des Booleschen Indexes auf True oder False die Zeilendaten herausfiltern, die beibehalten werden müssen.
import pandas as pd data = {'Name': ['Tom', 'Nick', 'John', 'David'], 'Age': [20, 25, 30, 35], 'Gender': ['M', 'M', 'M', 'M']} df = pd.DataFrame(data) # 删除索引为1到2的行数据 df = df.drop(df.index[1:3]) print(df)
Die Ausgabe lautet wie folgt:
Name Age Gender 0 Tom 20 M 3 David 35 M
Wie Sie sehen können, können wir durch Festlegen des Indexbereichs der Slicing-Operation mehrere aufeinanderfolgende Datenzeilen löschen.
import pandas as pd data = {'Name': ['Tom', 'Nick', 'John', 'David'], 'Age': [20, 25, 30, 35], 'Gender': ['M', 'M', 'M', 'M']} df = pd.DataFrame(data) # 设置第三行的索引为缺失 df.set_index(pd.Index(['0', '1', '3']), inplace=True) # 重置索引并删除缺失的行 df.reset_index(drop=True, inplace=True) print(df)
Die Ausgabe lautet wie folgt:
Name Age Gender 0 Tom 20 M 1 Nick 25 M 2 David 35 M
Wie Sie sehen können, können wir löschen, indem wir den Index auf die fehlende Zeile setzen und die Methode reset_index verwenden, um den Index zurückzusetzen und die fehlende Zeile zu löschen eine bestimmte Zeile.
Zusammenfassend gibt es hier einige gängige Methoden zum Löschen von Zeilendaten in Pandas DataFrame. Je nach Bedarf können wir eine geeignete Methode zur Erledigung der Datenverarbeitungsaufgabe auswählen. In praktischen Anwendungen können geeignete Methoden zum Löschen von Zeilendaten entsprechend bestimmten Umständen ausgewählt werden, um die Effizienz und Genauigkeit der Datenverarbeitung zu verbessern.
Das obige ist der detaillierte Inhalt vonVertiefendes Verständnis der Techniken zum Löschen von Zeilendaten in Pandas. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!