使用 nunique 计算 Pandas 中每组的唯一值
在 pandas 中,可以使用 nunique() 方法计算组中的唯一值。当您需要确定特定类别或组内不同值的数量时,这特别有用。
问题:
考虑具有以下内容的 DataFrame数据:
ID | domain |
---|---|
123 | vk.com |
123 | vk.com |
123 | twitter.com |
456 | vk.com |
456 | facebook.com |
456 | vk.com |
456 | google.com |
789 | twitter.com |
789 | vk.com |
任务是计算此 DataFrame 中每个域的唯一 ID。
解决方案:
计算唯一值每组,使用 nunique() 方法和所需的分组列。在本例中,域列代表组:
<code class="python">df = df.groupby('domain')['ID'].nunique() print(df)</code>
输出:
domain | count |
---|---|
facebook.com | 1 |
google.com | 1 |
twitter.com | 2 |
vk.com | 3 |
其他注意事项:
以上是如何在 Pandas 中使用 nunique() 计算组内的唯一值?的详细内容。更多信息请关注PHP中文网其他相关文章!