複数のデータフレーム列に基づいて頻度カウントを取得する
データフレーム内に同一の行が出現する頻度を決定するには、Pandas の groupby を使用できます。関数。次の例を考えてみましょう。
data = {'Group': ['Short', 'Short', 'Moderate', 'Moderate', 'Tall'], 'Size': ['Small', 'Small', 'Medium', 'Small', 'Large']} df = pd.DataFrame(data)
頻度カウントは 3 つの方法で計算できます。
オプション 1:
dfg = df.groupby(by=["Group", "Size"]).size()
これにより、次の出力を持つシリーズ:
Group Size Moderate Medium 1 Small 1 Short Small 2 Tall Large 1 dtype: int64
オプション 2:
dfg = df.groupby(by=["Group", "Size"]).size().reset_index(name="Time")
これにより、「Time」列が追加された DataFrame が生成されます:
Group Size Time 0 Moderate Medium 1 1 Moderate Small 1 2 Short Small 2 3 Tall Large 1
オプション 3:
dfg = df.groupby(by=["Group", "Size"], as_index=False).size()
これにより、オプション 2 の出力と同等の DataFrame も生成されます。
以上がPandas DataFrame 内の同一行の頻度をカウントするにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。