Wie rufe ich Zeilen mit eindeutigen Werten in einem Pandas-DataFrame ab?

Mary-Kate Olsen
Freigeben: 2024-11-04 04:11:30
Original
511 Leute haben es durchsucht

How to Retrieve Rows with Unique Values in a Pandas DataFrame?

Zeilen anhand eindeutiger Spaltenwerte abrufen: Eine umfassende Anleitung

Viele Programmierszenarien erfordern das Extrahieren von Zeilen basierend auf eindeutigen Werten in bestimmten Spalten. In diesem Artikel wird erläutert, wie Sie dies mithilfe der weit verbreiteten Pandas-Bibliothek in Python erreichen können.

Abfrage:

Betrachten Sie einen Datensatz mit zwei Spalten, COL1 und COL2, wie gezeigt unten:

COL1   COL2
a.com  22
b.com  45
c.com  34
e.com  45
f.com  56
g.com  22
h.com  45
Nach dem Login kopieren

Das Ziel besteht darin, nur die Zeilen abzurufen, in denen COL2 eindeutige Werte enthält. Die erwartete Ausgabe ist:

COL1  COL2
a.com 22
b.com 45
c.com 34
f.com 56
Nach dem Login kopieren

Lösung:

Die Methode drop_duplicates in Pandas bietet eine einfache Möglichkeit, doppelte Zeilen basierend auf einer oder mehreren Spalten zu entfernen. So nutzen Sie es für diese spezielle Aufgabe:

<code class="python">import pandas as pd

df = pd.DataFrame({'COL1': ['a.com', 'b.com', 'c.com', 'e.com', 'f.com', 'g.com', 'h.com'],
                  'COL2': [22, 45, 34, 45, 56, 22, 45]})

# Keep only the first occurrence of each unique value in COL2
df = df.drop_duplicates('COL2')

print(df)</code>
Nach dem Login kopieren

Ausgabe:

  COL1  COL2
0  a.com    22
1  b.com    45
2  c.com    34
4  f.com    56
Nach dem Login kopieren

Zusätzliche Optionen:

Die Methode drop_duplicates bietet zusätzliche Optionen Optionen zum Anpassen der Handhabung von Duplikaten:

  • keep='last': Behalten Sie das letzte Vorkommen jedes eindeutigen Werts bei.
  • keep=False : Alle doppelten Zeilen vollständig entfernen.

Hier sind Beispiele, die diese Optionen veranschaulichen:

<code class="python"># Keep only the last occurrence of each unique value in COL2
df = df.drop_duplicates('COL2', keep='last')

# Remove all duplicate rows from the dataset
df = df.drop_duplicates('COL2', keep=False)</code>
Nach dem Login kopieren

Das obige ist der detaillierte Inhalt vonWie rufe ich Zeilen mit eindeutigen Werten in einem Pandas-DataFrame ab?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Quelle:php.cn
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Neueste Artikel des Autors
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage
Über uns Haftungsausschluss Sitemap
Chinesische PHP-Website:Online-PHP-Schulung für das Gemeinwohl,Helfen Sie PHP-Lernenden, sich schnell weiterzuentwickeln!