Löschen aufeinanderfolgender Duplikate in Pandas
Um aufeinanderfolgende Duplikate aus einer Pandas-Serie zu entfernen, können verschiedene Methoden angewendet werden.
Methode 1: Shift verwenden
Der effizienteste Ansatz besteht darin, die Funktion „shift()“ zu nutzen:
a.loc[a.shift() != a]
Diese Methode vergleicht die Serie mit ihrer eigenen verschobenen Version. Erstellen einer booleschen Maske, in der aufeinanderfolgende Duplikate identifiziert werden.
Methode 2: Verwenden von Diff
Eine alternative Methode ist die Verwendung der diff()-Funktion:
a.loc[a.diff() != 0]
Dieser Ansatz ist jedoch bei großen Datensätzen etwas langsamer.
Aktualisierung:
Es ist wichtig zu beachten, dass die Verwendung von „shift()“ mit einem Standardzeitraum von 1 entspricht Shift(1). Daher erzeugt der folgende Code auch die gewünschte Ausgabe:
a.loc[a.shift(1) != a]
Durch die Verwendung dieser Methoden können Sie aufeinanderfolgende Duplikate effektiv aus Pandas-Serien entfernen und so sicherstellen, dass nur unterschiedliche Werte beibehalten werden.
Das obige ist der detaillierte Inhalt vonWie entferne ich aufeinanderfolgende Duplikate in einer Pandas-Serie?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!