首頁 後端開發 Python教學 如何對 Pandas DataFrame 欄位進行分箱並對每個分箱中的值進行計數?

如何對 Pandas DataFrame 欄位進行分箱並對每個分箱中的值進行計數?

Dec 16, 2024 pm 07:21 PM

How Can I Bin a Pandas DataFrame Column and Count Values in Each Bin?

將列與 Pandas 分箱

資料操作通常涉及將值組織到有意義的群組或箱中。在這種情況下,我們將探索如何使用 pandas 對包含數值的欄位進行分箱。

問題:

給定一個包含數值的資料框列,我們想要將其視覺化為具有數值計數的容器。具體來說,我們如何確定每個 bin 內的值的數量?

答案:

選項 1:使用 pandas.cut

pandas.cut 函數可用於建立 bin。以下是一個範例:

import pandas as pd

bins = [0, 1, 5, 10, 25, 50, 100]
df['binned'] = pd.cut(df['percentage'], bins)
df['binned'].value_counts()
登入後複製

這將根據指定的間隔建立 bin,並傳回包含每個值的 bin 所分配的序列。使用 value_counts,我們可以計算每個 bin 中出現的次數。

選項2:使用numpy.searchsorted

另一種方法是使用numpy.searchsorted:

import numpy as np

bins = [0, 1, 5, 10, 25, 50, 100]
df['binned'] = np.searchsorted(bins, df['percentage'].values)
df['binned'].value_counts()
登入後複製

此函數傳回每個值所屬的第一個bin 的索引。然後我們可以使用 value_counts 來確定 bin 計數。

選項 3:組合 Groupby 和 Size

我們也可以使用 pandas 的 groupby 和 size 方法:

s = df.groupby(pd.cut(df['percentage'], bins)).size()
登入後複製

這將按箱分配對資料框進行分組,並傳回一個序列,其中包含每個值的數量bin.

結論:

這些方法使我們能夠有效地對數字列進行分箱並獲取每個分箱的值計數,從而深入了解值的分佈。

以上是如何對 Pandas DataFrame 欄位進行分箱並對每個分箱中的值進行計數?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱門文章

倉庫:如何復興隊友
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
Hello Kitty Island冒險:如何獲得巨型種子
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
1 週前 By 尊渡假赌尊渡假赌尊渡假赌

熱門文章

倉庫:如何復興隊友
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
Hello Kitty Island冒險:如何獲得巨型種子
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
1 週前 By 尊渡假赌尊渡假赌尊渡假赌

熱門文章標籤

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

我如何使用美麗的湯來解析HTML? 我如何使用美麗的湯來解析HTML? Mar 10, 2025 pm 06:54 PM

我如何使用美麗的湯來解析HTML?

python中的圖像過濾 python中的圖像過濾 Mar 03, 2025 am 09:44 AM

python中的圖像過濾

如何使用Python查找文本文件的ZIPF分佈 如何使用Python查找文本文件的ZIPF分佈 Mar 05, 2025 am 09:58 AM

如何使用Python查找文本文件的ZIPF分佈

如何使用Python使用PDF文檔 如何使用Python使用PDF文檔 Mar 02, 2025 am 09:54 AM

如何使用Python使用PDF文檔

如何在django應用程序中使用redis緩存 如何在django應用程序中使用redis緩存 Mar 02, 2025 am 10:10 AM

如何在django應用程序中使用redis緩存

如何使用TensorFlow或Pytorch進行深度學習? 如何使用TensorFlow或Pytorch進行深度學習? Mar 10, 2025 pm 06:52 PM

如何使用TensorFlow或Pytorch進行深度學習?

如何在Python中實現自己的數據結構 如何在Python中實現自己的數據結構 Mar 03, 2025 am 09:28 AM

如何在Python中實現自己的數據結構

python對象的序列化和避難所化:第1部分 python對象的序列化和避難所化:第1部分 Mar 08, 2025 am 09:39 AM

python對象的序列化和避難所化:第1部分

See all articles