从多个数据帧列获取频率计数
要确定数据帧中相同行的频率,您可以使用 groupby() 方法使用 size() 函数。此技术使您能够计算多列中唯一值组合的出现次数。
考虑以下数据框:
Group | Size | ---------+------+ Short | Small | Short | Small | Moderate | Medium | Moderate | Small | Tall | Large |
要计算每行的频率,我们可以对数据框进行分组通过“Group”和“Size”列,并使用 size() 函数来确定每行出现的次数:
<code class="python">import pandas as pd # Load the sample data data = {'Group': ['Short', 'Short', 'Moderate', 'Moderate', 'Tall'], 'Size': ['Small', 'Small', 'Medium', 'Small', 'Large']} df = pd.DataFrame(data) # Option 1: dfg = df.groupby(by=["Group", "Size"]).size() # Option 2: Reset the index to convert the Series to a DataFrame dfg = df.groupby(by=["Group", "Size"]).size().reset_index(name="Time") # Option 3: Use as_index=False to create a DataFrame without an index dfg = df.groupby(by=["Group", "Size"], as_index=False).size()</code>
生成的数据帧将提供“Group”的每个组合的频率计数”和“尺寸”值。例如,输出可能如下所示:
Group | Size | Time --------+------+------ Moderate | Medium | 1 Moderate | Small | 1 Short | Small | 2 Tall | Large | 1
以上是如何根据多列计算 pandas DataFrame 中相同行的频率?的详细内容。更多信息请关注PHP中文网其他相关文章!