Vertiefendes Verständnis der Techniken zum Löschen von Zeilendaten in Pandas

WBOY
Freigeben: 2024-01-09 11:21:55
Original
894 Leute haben es durchsucht

Vertiefendes Verständnis der Techniken zum Löschen von Zeilendaten in Pandas

Kenntnisse zur Datenverarbeitung: Detaillierte Erklärung zum Löschen von Zeilen in Pandas

Bei der Datenverarbeitung ist es häufig erforderlich, bestimmte Datenzeilen im DataFrame zu löschen. Pandas ist eine leistungsstarke Datenverarbeitungsbibliothek, die verschiedene Methoden zum Implementieren von Löschvorgängen für Zeilendaten bereitstellt. In diesem Artikel werden verschiedene gängige Methoden zum Löschen von Zeilen in Pandas ausführlich vorgestellt und spezifische Codebeispiele bereitgestellt.

  1. Verwenden Sie die Drop-Methode
    Das DataFrame-Objekt von Pandas stellt die Drop-Methode bereit, mit der Zeilen durch Angabe des Zeilenindex oder der Zeilenbezeichnung gelöscht werden können. Hier ist ein einfaches Beispiel:
import pandas as pd

data = {'Name': ['Tom', 'Nick', 'John', 'David'],
        'Age': [20, 25, 30, 35],
        'Gender': ['M', 'M', 'M', 'M']}

df = pd.DataFrame(data)

# 删除索引为2的行数据
df = df.drop(2)

print(df)
Nach dem Login kopieren

Die Ausgabe ist wie folgt:

   Name  Age Gender
0   Tom   20      M
1  Nick   25      M
3  David  35      M
Nach dem Login kopieren

Wie Sie sehen können, gibt die Drop-Methode einen neuen DataFrame zurück und löscht die angegebenen Zeilen im Ergebnis.

  1. Boolesche Indizierung verwenden
    In einigen Fällen müssen wir möglicherweise Zeilen basierend auf einer Bedingung löschen. Die boolesche Indizierung von Pandas bietet hierfür eine einfache Möglichkeit. Hier ist ein Beispiel:
import pandas as pd

data = {'Name': ['Tom', 'Nick', 'John', 'David'],
        'Age': [20, 25, 30, 35],
        'Gender': ['M', 'M', 'M', 'M']}

df = pd.DataFrame(data)

# 删除所有年龄小于30的行数据
df = df[df['Age'] >= 30]

print(df)
Nach dem Login kopieren

Die Ausgabe lautet wie folgt:

   Name  Age Gender
2  John  30      M
3  David 35      M
Nach dem Login kopieren

Wie Sie sehen können, können wir durch Setzen des Booleschen Indexes auf True oder False die Zeilendaten herausfiltern, die beibehalten werden müssen.

  1. Slicing-Vorgang verwenden
    Wenn Sie mehrere aufeinanderfolgende Datenzeilen löschen möchten, können Sie dazu den Slicing-Vorgang verwenden. Hier ist ein Beispiel:
import pandas as pd

data = {'Name': ['Tom', 'Nick', 'John', 'David'],
        'Age': [20, 25, 30, 35],
        'Gender': ['M', 'M', 'M', 'M']}

df = pd.DataFrame(data)

# 删除索引为1到2的行数据
df = df.drop(df.index[1:3])

print(df)
Nach dem Login kopieren

Die Ausgabe lautet wie folgt:

   Name  Age Gender
0   Tom   20      M
3  David 35      M
Nach dem Login kopieren

Wie Sie sehen können, können wir durch Festlegen des Indexbereichs der Slicing-Operation mehrere aufeinanderfolgende Datenzeilen löschen.

  1. Verwenden Sie die Methoden set_index und reset_index.
    Wenn der Zeilenindex des DataFrame ein numerischer Typ ist und Zeilen fehlen, können Sie die Methoden set_index und reset_index verwenden, um die fehlenden Zeilen zu löschen. Hier ist ein Beispiel:
import pandas as pd

data = {'Name': ['Tom', 'Nick', 'John', 'David'],
        'Age': [20, 25, 30, 35],
        'Gender': ['M', 'M', 'M', 'M']}

df = pd.DataFrame(data)

# 设置第三行的索引为缺失
df.set_index(pd.Index(['0', '1', '3']), inplace=True)

# 重置索引并删除缺失的行
df.reset_index(drop=True, inplace=True)

print(df)
Nach dem Login kopieren

Die Ausgabe lautet wie folgt:

   Name  Age Gender
0   Tom   20      M
1  Nick  25      M
2  David 35      M
Nach dem Login kopieren

Wie Sie sehen können, können wir löschen, indem wir den Index auf die fehlende Zeile setzen und die Methode reset_index verwenden, um den Index zurückzusetzen und die fehlende Zeile zu löschen eine bestimmte Zeile.

Zusammenfassend gibt es hier einige gängige Methoden zum Löschen von Zeilendaten in Pandas DataFrame. Je nach Bedarf können wir eine geeignete Methode zur Erledigung der Datenverarbeitungsaufgabe auswählen. In praktischen Anwendungen können geeignete Methoden zum Löschen von Zeilendaten entsprechend bestimmten Umständen ausgewählt werden, um die Effizienz und Genauigkeit der Datenverarbeitung zu verbessern.

Das obige ist der detaillierte Inhalt vonVertiefendes Verständnis der Techniken zum Löschen von Zeilendaten in Pandas. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Verwandte Etiketten:
Quelle:php.cn
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage