Gruppieren einer Pandas-Spalte mit benutzerdefinierten Bins und Wertzählungen
Bei der Arbeit mit numerischen Daten ist es oft nützlich, Werte in Bins zu gruppieren Muster oder Trends erkennen. Dieser als Binning bezeichnete Vorgang kann einfach mit der Pandas-Bibliothek durchgeführt werden.
Um eine Spalte zu binieren, können Sie die Funktion pandas.cut verwenden. So funktioniert es in dem von Ihnen bereitgestellten Beispiel:
bins = [0, 1, 5, 10, 25, 50, 100] df['binned'] = pd.cut(df['percentage'], bins)
Dieser Code erstellt eine neue Spalte namens „binned“ in Ihrem DataFrame. Jeder Wert in dieser Spalte stellt die Klasse dar, zu der der entsprechende numerische Wert in der Prozentspalte gehört. Der Bins-Parameter gibt die Grenzen der Bins an.
Um die Verteilung der Werte über die Bins hinweg zu visualisieren, können Sie die Funktion value_counts verwenden:
df['binned'].value_counts()
Dieser Code gibt die Anzahl der Vorkommen zurück von jedem Behälter, wodurch effektiv die Wertanzahl für die Behälter bereitgestellt wird.
Zum Beispiel, wenn Sie Folgendes haben Daten:
df['percentage'].head() 46.5 44.2 100.0 42.12
Und Sie verwenden die folgenden Bins:
bins = [0, 1, 5, 10, 25, 50, 100]
Die Ausgabe von df['binned'].value_counts() wäre:
(25, 50] 3 (50, 100] 1
Das bedeutet, dass drei Werte in die Klasse (25, 50) fallen und ein Wert in die Klasse (50, 100) fällt.
Das obige ist der detaillierte Inhalt vonWie kann ich eine Pandas-Spalte mit benutzerdefinierten Bins einteilen und Wertzählungen abrufen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!