Das Zählen eindeutiger Werte, die nach einer bestimmten Spalte gruppiert sind, ist eine häufige Aufgabe bei der Datenanalyse. Pandas bietet verschiedene Methoden, um dies zu erreichen.
In Ihrem Fall haben Sie einen DataFrame mit den Spalten „ID“ und „Domäne“ und müssen eindeutige „ID“-Werte für jede „Domäne“ zählen.
Mit df.groupby['domain', 'ID'].count()':
Diese Methode gibt einen DataFrame mit Anzahlen für die Gruppen „ID“ und „Domäne“ zurück . Es zählt jedoch die Anzahl der Zeilen in jeder Gruppe, nicht nur die eindeutigen „ID“-Werte.
Lösung mit `nunique()':
df.groupby ('domain')['ID'].nunique() berechnet die eindeutige 'ID'-Anzahl für jede 'Domain'-Gruppe. Der resultierende DataFrame hat die Spalte „Domäne“ als Index und die Anzahl als neue Spalte.
Einfache Anführungszeichen entfernen:
Wenn Ihre Spalte „Domäne“ enthält Einfache Anführungszeichen, verwenden Sie df.domain.str.strip("'"), um sie vor dem Gruppieren zu entfernen.
Spaltennamen beibehalten:
Um die „ID“ beizubehalten Um den Spaltennamen im Ergebnis anzuzeigen, verwenden Sie df.groupby(by='domain', as_index=False).agg({'ID': pd.Series.nunique}). Dadurch wird ein DataFrame mit den Spalten „Domäne“ und „ID“ (eindeutige Anzahl) erstellt.
Das obige ist der detaillierte Inhalt vonWie zähle ich nach einer Spalte gruppierte Einzelwerte mit Pandas?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!