使用 'count(distinct)' 在 Pandas 中等效的 SQL 查询
在 SQL 中,可以使用以下方法来实现计算列中的不同值“计数(不同)”功能。例如,要计算每年每月的唯一客户端代码:
<code class="sql">SELECT count(distinct CLIENTCODE) FROM table GROUP BY YEARMONTH;</code>
可以在分组 DataFrame 上使用“nunique()”方法在 Pandas 中执行类似的操作。通过按“YEARMONTH”列对数据进行分组,然后对“CLIENTCODE”列调用“nunique()”,我们可以获得每年每月的唯一客户数量。
<code class="python">table.groupby('YEARMONTH').CLIENTCODE.nunique()</code>
示例:
考虑一个包含以下列的 DataFrame “表”:
CLIENTCODE | YEARMONTH |
---|---|
1 | 201301 |
1 | 201301 |
2 | 201301 |
1 | 201302 |
2 | 201302 |
2 | 201302 |
3 | 201302 |
应用上述代码会产生:
<code class="python">Out[3]: YEARMONTH 201301 2 201302 3</code>
此输出与预期匹配结果,显示每年每月的唯一客户数量。
以上是如何使用'nunique()”在 Pandas 中执行等效的 SQL'count(distinct)”?的详细内容。更多信息请关注PHP中文网其他相关文章!