Pandas データのグループ化数と最大数の取得
問題:
Pandas データフレームが指定された場合複数の列がある場合、2 つの特定の列ごとに行を効率的にグループ化し、各グループの数を取得するにはどうすればよいでしょうか?さらに、グループ化列の 1 つの各値の最大数はどのように決定しますか?
解決策:
DataFrame 行を 2 つの列でグループ化し、出現回数をカウントするには、groupby() 関数の後に size() メソッドを使用します。
<code class="python">df.groupby(['col5', 'col2']).size()</code>
この操作は、指定された列に基づいてグループを作成し、各グループの行数を返します。出力は次のようになります:
col5 col2 count 1 A 1 D 3 2 B 2 ...
col2 列の各値の最大カウントを見つけるには:
<code class="python">df.groupby(['col5', 'col2']).size().groupby(level=1).max()</code>
この操作は、col2 列レベルでカウント データをグループ化し、各 Col2 値の最大カウントを返し、次のような出力を生成します。
col2 A 3 B 2 C 1 D 3
追加メモ:
複数の列でグループ化し、カウントと追加の概要統計を取得するには、groupby() を agg() などの他のメソッドと組み合わせて使用すると、複数の集計関数を指定できます:
<code class="python">df.groupby(['col5', 'col2']).agg(['count', 'mean', 'max'])</code>
以上がPandas データをグループ化し、出現回数をカウントし、最大数を見つけるにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。