根據多個Dataframe 欄位取得頻率計數
要找出資料框中多次出現的行的頻率,您可以使用具有大小或計數函數的groupby 操作。讓我們用一個示例數據框來演示這一點:
import pandas as pd # Sample dataframe data = {'Group': ['Short', 'Short', 'Moderate', 'Moderate', 'Tall'], 'Size': ['Small', 'Small', 'Medium', 'Small', 'Large']} df = pd.DataFrame(data)
選項1:使用groupby 和size
dfg = df.groupby(['Group', 'Size']).size() print(dfg)
輸出:
Group Size Moderate Medium 1 Small 1 Short Small 2 Tall Large 1 dtype: int64
選項2:使用groupby、size和reset_index
dfg = df.groupby(['Group', 'Size']).size().reset_index(name='Time') print(dfg)
輸出:
Group Size Time 0 Moderate Medium 1 1 Moderate Small 1 2 Short Small 2 3 Tall Large 1
選項3:使用groupby、size和groupby、size as_index
dfg = df.groupby(['Group', 'Size'], as_index=False).size() print(dfg)
輸出:
Group Size Time 0 Moderate Medium 1 1 Moderate Small 1 2 Short Small 2 3 Tall Large 1
每個選項都會傳回一個包含Group 和Size 列的資料框,指示原始資料框中出現的特定行組合。附加的“時間”列顯示每個組合的頻率計數。
以上是如何計算 Pandas DataFrame 中基於多列的行的頻率?的詳細內容。更多資訊請關注PHP中文網其他相關文章!