カスタマイズされたビンと値カウントを使用したパンダ列のビン化
数値データを扱う場合、値をビンにグループ化すると便利なことがよくあります。パターンや傾向を検出します。ビニングと呼ばれるこのプロセスは、pandas ライブラリを使用して簡単に実行できます。
列をビニングするには、pandas.cut 関数を使用できます。提供した例での動作は次のとおりです。
bins = [0, 1, 5, 10, 25, 50, 100] df['binned'] = pd.cut(df['percentage'], bins)
このコードは、DataFrame に binned という新しい列を作成します。この列の各値は、パーセント列の対応する数値が属するビンを表します。 bins パラメーターは、ビンの境界を指定します。
ビン全体の値の分布を視覚化するには、value_counts 関数を使用できます。
df['binned'].value_counts()
このコードは出現回数を返します。各ビンの値を効率的に提供し、ビンの値カウントを提供します。
たとえば、次のような場合data:
df['percentage'].head() 46.5 44.2 100.0 42.12
そして、次のビンを使用します:
bins = [0, 1, 5, 10, 25, 50, 100]
df['binned'].value_counts() の出力は次のようになります:
(25, 50] 3 (50, 100] 1
これは、3 つの値がビン (25, 50] 内にあり、1 つの値がビン (50, 50) 内にあることを意味します。 100].
以上がカスタム ビンを使用して Pandas 列をビン化し、値の数を取得するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。