在 Pandas 中查找每年的唯一客户端计数,相当于 SQL 的“count(distinct)”
在 SQL 中,计算每年的不同客户端可以通过以下查询来实现:
<code class="sql">SELECT count(distinct CLIENTCODE) FROM table GROUP BY YEARMONTH;</code>
要在通常用作数据库替代品的 Pandas 中执行类似的操作,您可以使用 nunique() 函数和 groupby() 方法:
<code class="python">table.groupby('YEARMONTH').CLIENTCODE.nunique()</code>
此代码片段按“YEARMONTH”列对数据框表进行分组,然后应用 nunique() 函数来计算每年的唯一客户端数。结果将是一个 pandas 系列,以年月为索引,以每年的唯一客户端数量为值。
例如,如果您的表包含以下数据:
CLIENTCODE | YEARMONTH |
---|---|
1 | 201301 |
1 | 201301 |
2 | 201301 |
1 | 201302 |
2 | 201302 |
2 | 201302 |
3 | 201302 |
应用 nunique() 函数将产生以下输出:
<code class="python">YEARMONTH 201301 2 201302 3</code>
此结果表明,对于 201301,有 2 个唯一客户端,对于 201302,有 3 个唯一客户端。
以上是Pandas 如何实现每年相当于 SQL 的'count(distinct)”的客户端计数?的详细内容。更多信息请关注PHP中文网其他相关文章!