使用'count(distinct)' 在Pandas 中等效的SQL 查詢
在SQL 中,可以使用以下方法來實現計算列中的不同值“計數(不同)”功能。例如,要計算每年每月的唯一客戶端程式碼:
<code class="sql">SELECT count(distinct CLIENTCODE) FROM table GROUP BY YEARMONTH;</code>
可以在分組 DataFrame 上使用「nunique()」方法在 Pandas 中執行類似的操作。透過按下“YEARMONTH”欄位對資料進行分組,然後對“CLIENTCODE”欄位呼叫“nunique()”,我們可以獲得每年每月的唯一客戶數量。
<code class="python">table.groupby('YEARMONTH').CLIENTCODE.nunique()</code>
範例:
考慮一個包含以下列的DataFrame 「表」:
CLIENTCODE | YEARMONTH |
---|---|
1 | 201301 |
1 | 201301 |
2 | 201301 |
1 | 201302 |
2 | 201302 |
2 | 201302 |
3 | 201302 |
應用上述程式碼會產生:
<code class="python">Out[3]: YEARMONTH 201301 2 201302 3</code>
此輸出與預期匹配結果,顯示每年每月的唯一客戶數量。
以上是如何使用'nunique()”在 Pandas 中執行等效的 SQL'count(distinct)”?的詳細內容。更多資訊請關注PHP中文網其他相關文章!