So entfernen Sie doppelte Spalten in Pandas
Wenn Sie es mit einem DataFrame zu tun haben, der doppelte Spalten enthält, möchten Sie diese möglicherweise entfernen zur Datenkonsistenz oder zu Analysezwecken. Hier ist eine einfache Lösung, um dies zu erreichen:
<code class="python">df = df.loc[:,~df.columns.duplicated()].copy()</code>
Mechanismus:
Hinweis:Diese Methode prüft auf Duplikate basierend auf Spaltennamen, nicht auf Spaltenwerten.
Alternative Ansätze:
Entfernen von Duplikaten Indizes:
<code class="python">df = df.loc[~df.index.duplicated(),:].copy()</code>
Dadurch werden alle doppelten Zeilen mithilfe eines ähnlichen Mechanismus wie oben entfernt, es wird jedoch der Index anstelle der Spaltennamen überprüft.
Entfernen von Duplikaten nach Werten ( Achtung):
<code class="python">df = df.loc[:,~df.apply(lambda x: x.duplicated(),axis=1).all()].copy()</code>
Dieser Ansatz scannt jede Spalte und entfernt sie, wenn alle Werte in dieser Spalte dupliziert sind. Es sollte jedoch mit Vorsicht verwendet werden, da es Werte und nicht Spaltennamen prüft und möglicherweise nicht in allen Fällen die gewünschten Ergebnisse liefert.
Das obige ist der detaillierte Inhalt vonWie entferne ich doppelte Spalten in Pandas?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!