Werthäufigkeit in einer DataFrame-Spalte ermitteln
Bei der Datenanalyse ist es häufig erforderlich, die Häufigkeit des Auftretens von Werten in einer bestimmten Spalte zu zählen eines DataFrames. Um dies zu erreichen, stellt Pandas mehrere Funktionen bereit.
Ein gängiger Ansatz ist die Verwendung der Methode value_counts(). Zum Beispiel mit dem DataFrame:
category | |
---|---|
cat | a |
cat | b |
cat | a |
Die Verwendung von value_counts() gibt die eindeutigen Werte und ihre Häufigkeiten zurück:
df = pd.DataFrame({'category': ['cat a', 'cat b', 'cat a']}) df['category'].value_counts()
Ausgabe:
category | freq |
---|---|
cat a | 2 |
cat b | 1 |
Eine andere Methode besteht darin, die Funktionen groupby() und count() zu verwenden. Dieser Ansatz gruppiert den DataFrame nach der Spalte von Interesse und zählt die Vorkommen für jeden Wert innerhalb der Gruppe:
df.groupby('category').count()
Ausgabe:
category | count |
---|---|
cat a | 2 |
cat b | 1 |
Zum Schluss noch die Häufigkeit hinzufügen Wenn man den ursprünglichen DataFrame verwendet, kann man mit der Funktion transform() eine neue Spalte mit den Häufigkeiten erstellen:
df['freq'] = df.groupby('category')['category'].transform('count')
Dies führt zu Folgendem DataFrame:
category | freq | |
---|---|---|
cat | a | 2 |
cat | b | 1 |
cat | a | 2 |
Durch die Nutzung dieser Methoden können Datenanalysten die Häufigkeit von Werten in DataFrame-Spalten effizient analysieren und so wertvolle Erkenntnisse für die Entscheidungsfindung liefern.
Das obige ist der detaillierte Inhalt vonWie kann ich Werthäufigkeiten in einer Pandas DataFrame-Spalte effizient zählen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!