Zeilen anhand eindeutiger Spaltenwerte abrufen: Eine umfassende Anleitung
Viele Programmierszenarien erfordern das Extrahieren von Zeilen basierend auf eindeutigen Werten in bestimmten Spalten. In diesem Artikel wird erläutert, wie Sie dies mithilfe der weit verbreiteten Pandas-Bibliothek in Python erreichen können.
Abfrage:
Betrachten Sie einen Datensatz mit zwei Spalten, COL1 und COL2, wie gezeigt unten:
COL1 COL2 a.com 22 b.com 45 c.com 34 e.com 45 f.com 56 g.com 22 h.com 45
Das Ziel besteht darin, nur die Zeilen abzurufen, in denen COL2 eindeutige Werte enthält. Die erwartete Ausgabe ist:
COL1 COL2 a.com 22 b.com 45 c.com 34 f.com 56
Lösung:
Die Methode drop_duplicates in Pandas bietet eine einfache Möglichkeit, doppelte Zeilen basierend auf einer oder mehreren Spalten zu entfernen. So nutzen Sie es für diese spezielle Aufgabe:
<code class="python">import pandas as pd df = pd.DataFrame({'COL1': ['a.com', 'b.com', 'c.com', 'e.com', 'f.com', 'g.com', 'h.com'], 'COL2': [22, 45, 34, 45, 56, 22, 45]}) # Keep only the first occurrence of each unique value in COL2 df = df.drop_duplicates('COL2') print(df)</code>
Ausgabe:
COL1 COL2 0 a.com 22 1 b.com 45 2 c.com 34 4 f.com 56
Zusätzliche Optionen:
Die Methode drop_duplicates bietet zusätzliche Optionen Optionen zum Anpassen der Handhabung von Duplikaten:
Hier sind Beispiele, die diese Optionen veranschaulichen:
<code class="python"># Keep only the last occurrence of each unique value in COL2 df = df.drop_duplicates('COL2', keep='last') # Remove all duplicate rows from the dataset df = df.drop_duplicates('COL2', keep=False)</code>
Das obige ist der detaillierte Inhalt vonWie rufe ich Zeilen mit eindeutigen Werten in einem Pandas-DataFrame ab?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!