Eindeutige Zeilenwerte aus einem DataFrame abrufen
In dieser Situation zielen wir darauf ab, Zeilen aus einem DataFrame basierend auf eindeutigen Werten in einem bestimmten zu extrahieren Spalte, bezeichnen wir sie als COL2.
Um diese Aufgabe zu erfüllen, führen wir die Funktion drop_duplicates ein. Es ermöglicht uns, doppelte Zeilen zu eliminieren, indem wir die Spalten angeben, die wir auf doppelte Werte überprüfen möchten.
Erstes Vorkommen beibehalten:
Zum Beispiel, wenn wir nur behalten möchten Beim ersten Auftreten jedes einzelnen COL2-Werts können wir Folgendes verwenden:
<code class="python">df = df.drop_duplicates('COL2')</code>
Alternativ können wir schreiben:
<code class="python">df = df.drop_duplicates('COL2', keep='first')</code>
Dadurch bleibt die erste Zeile für jeden erhalten eindeutiger Wert in COL2.
Beibehalten des letzten Vorkommens:
Wenn wir stattdessen das letzte Vorkommen eindeutiger Werte beibehalten möchten, ändern wir den Keep-Parameter in „last“:
<code class="python">df = df.drop_duplicates('COL2', keep='last')</code>
Alle Duplikate entfernen:
Um alle doppelten Zeilen zu entfernen, einschließlich derjenigen mit identischen Werten in COL2, setzen wir „Keep“ auf „Falsch“:
<code class="python">df = df.drop_duplicates('COL2', keep=False)</code>
Durch die Befolgung dieser Techniken können Sie doppelte Zeilen basierend auf unterschiedlichen Werten in der angegebenen Spalte effizient entfernen und so sicherstellen, dass Ihr DataFrame nur eindeutige Daten enthält.
Das obige ist der detaillierte Inhalt vonWie rufe ich in Pandas eindeutige Zeilenwerte aus einem DataFrame ab?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!