ホームページ > バックエンド開発 > Python チュートリアル > カスタム ビンを使用して Pandas 列をビン化し、値の数を取得するにはどうすればよいですか?

カスタム ビンを使用して Pandas 列をビン化し、値の数を取得するにはどうすればよいですか?

Mary-Kate Olsen
リリース: 2024-12-12 22:59:15
オリジナル
886 人が閲覧しました

How Can I Bin a Pandas Column with Custom Bins and Get Value Counts?

カスタマイズされたビンと値カウントを使用したパンダ列のビン化

数値データを扱う場合、値をビンにグループ化すると便利なことがよくあります。パターンや傾向を検出します。ビニングと呼ばれるこのプロセスは、pandas ライブラリを使用して簡単に実行できます。

列をビニングするには、pandas.cut 関数を使用できます。提供した例での動作は次のとおりです。

bins = [0, 1, 5, 10, 25, 50, 100]
df['binned'] = pd.cut(df['percentage'], bins)
ログイン後にコピー

このコードは、DataFrame に binned という新しい列を作成します。この列の各値は、パーセント列の対応する数値が属するビンを表します。 bins パラメーターは、ビンの境界を指定します。

ビン全体の値の分布を視覚化するには、value_counts 関数を使用できます。

df['binned'].value_counts()
ログイン後にコピー

このコードは出現回数を返します。各ビンの値を効率的に提供し、ビンの値カウントを提供します。

たとえば、次のような場合data:

df['percentage'].head()
46.5
44.2
100.0
42.12
ログイン後にコピー

そして、次のビンを使用します:

bins = [0, 1, 5, 10, 25, 50, 100]
ログイン後にコピー

df['binned'].value_counts() の出力は次のようになります:

(25, 50]     3
(50, 100]    1
ログイン後にコピー

これは、3 つの値がビン (25, 50] 内にあり、1 つの値がビン (50, 50) 内にあることを意味します。 100].

以上がカスタム ビンを使用して Pandas 列をビン化し、値の数を取得するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
著者別の最新記事
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート