首頁 > 資料庫 > mysql教程 > 如何在 Pandas 中實作 SQL 的 GROUP BY HAVING 子句?

如何在 Pandas 中實作 SQL 的 GROUP BY HAVING 子句?

Susan Sarandon
發布: 2025-01-10 17:29:41
原創
912 人瀏覽過

How to Implement SQL's GROUP BY HAVING Clause in Pandas?

Pandas 中 SQL 的 GROUP BY HAVING 子句實作

在 SQL 中,GROUP BY 操作會根據指定列的值將資料分割為子集。 HAVING 子句對這些子集套用篩選器約束。此功能允許選擇性資料聚合和過濾。

在 Pandas 中,GROUP BY 功能可透過 groupby() 方法實現,該方法傳回一個 GroupBy 物件。 Pandas 中等效於 SQL HAVING 子句的是 filter() 方法,它對 groupby() 建立的子集套用篩選器。

文法:

<code>df.groupby(by_column).filter(filter_function)</code>
登入後複製

其中:

  • df 是 Pandas DataFrame。
  • by_column 是用於分組的欄位。
  • filter_function 是一個為每個群組傳回布林值的函數。

用法:

要在 Pandas 中對分組資料集套用篩選器,請執行下列步驟:

  1. 透過對 DataFrame 呼叫 groupby() 建立 GroupBy 物件。
  2. 使用 filter() 方法將 filter_function 應用於每組。
  3. filter_function 應為每個群組傳回一個布林值。
  4. 過濾後的群組將作為新的 DataFrame 傳回。

範例:

假設我們有以下 Pandas DataFrame:

<code>df = pd.DataFrame([[1, 2], [1, 3], [5, 6]], columns=['A', 'B'])</code>
登入後複製

要找 B 列總和大於 4 的群組,我們可以使用以下程式碼:

<code>result = df.groupby('A').filter(lambda x: x['B'].sum() > 4)</code>
登入後複製

結果將是一個新的 DataFrame,其中包含滿足過濾器條件的群組中的行:

<code>print(result)</code>
登入後複製

輸出:

<code>   A  B
0  1  2
1  1  3</code>
登入後複製

附加說明:

  • filter_function 可以是任何有效的 Python 函數,它接受 Pandas 群組作為輸入並傳回布林值。
  • 重要的是要注意,filter_function 無法存取用於分組的欄位。如果您需要存取這些列,可以在套用篩選器之前手動按列分組。
  • Pandas 中的 GROUP BY HAVING 功能提供了一種強大的方法來執行複雜的資料聚合和過濾操作。

以上是如何在 Pandas 中實作 SQL 的 GROUP BY HAVING 子句?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
作者最新文章
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板