Heim > Backend-Entwicklung > Python-Tutorial > Wie kann ich eine Pandas-Spalte mithilfe von Pandas.cut und NumPy.searchsorted effektiv einteilen?

Wie kann ich eine Pandas-Spalte mithilfe von Pandas.cut und NumPy.searchsorted effektiv einteilen?

Barbara Streisand
Freigeben: 2024-12-09 11:17:04
Original
1101 Leute haben es durchsucht

How Can I Effectively Bin a Pandas Column Using Pandas.cut and NumPy.searchsorted?

Binning einer Pandas-Spalte

Binning beinhaltet das Unterteilen einer kontinuierlichen Datenspalte in diskrete Intervalle, um die Datenverteilung zu analysieren. Um eine Spalte mit numerischen Werten mithilfe von Pandas zu unterteilen, können wir verschiedene Methoden erkunden.

Pandas.cut-Methode

Pandas bietet die Cut-Funktion zum Durchführen der Unterteilung. Es benötigt die zu klassifizierende Reihe und eine Liste von Klassenkanten als Argumente. Standardmäßig wird eine kategoriale Spalte mit Bin-Beschriftungen zurückgegeben. Zum Beispiel:

bins = [0, 1, 5, 10, 25, 50, 100]
df['binned'] = pd.cut(df['percentage'], bins)
Nach dem Login kopieren

NumPy.searchsorted-Methode

NumPys searchsorted-Funktion kann auch zum Binning verwendet werden. Es gibt den Index des Bins zurück, in den jeder Wert in der Reihe fällt. Die resultierenden Werte können dann verwendet werden, um eine gruppierte Kategorie zu erstellen:

df['binned'] = np.searchsorted(bins, df['percentage'].values)
Nach dem Login kopieren

Wertanzahl berechnen

Sobald die gruppierte Spalte erstellt ist, können wir die Wertanzahl berechnen, um die Anzahl der Beobachtungen zu bestimmen jeder Behälter. Dies kann entweder mithilfe von value_counts oder groupby und Aggregatgröße erreicht werden:

s = pd.cut(df['percentage'], bins=bins).value_counts()
Nach dem Login kopieren
s = df.groupby(pd.cut(df['percentage'], bins=bins)).size()
Nach dem Login kopieren

Durch die Verwendung dieser Techniken können wir numerische Datenspalten in Pandas effektiv gruppieren, um Einblicke in ihre Verteilung zu gewinnen.

Das obige ist der detaillierte Inhalt vonWie kann ich eine Pandas-Spalte mithilfe von Pandas.cut und NumPy.searchsorted effektiv einteilen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Quelle:php.cn
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Neueste Artikel des Autors
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage