使用 Pandas Group-By Sum 以名稱計算水果總數
分組和聚合是處理資料時的基本操作。 Pandas 提供了強大的 GroupBy 函數來簡化這些過程。
考慮以下DataFrame,您要在其中計算每個名稱購買的水果總數:
Fruit Date Name Number Apples 10/6/2016 Bob 7 Apples 10/6/2016 Bob 8 Apples 10/6/2016 Mike 9 Apples 10/7/2016 Steve 10 Apples 10/7/2016 Bob 1 Oranges 10/7/2016 Bob 2 Oranges 10/6/2016 Tom 15 Oranges 10/6/2016 Mike 57 Oranges 10/6/2016 Bob 65 Oranges 10/7/2016 Tony 1 Grapes 10/7/2016 Bob 1 Grapes 10/7/2016 Tom 87 Grapes 10/7/2016 Bob 22 Grapes 10/7/2016 Bob 12 Grapes 10/7/2016 Tony 15
為了實現這一點,我們可以使用GroupBy 函數按“名稱”和“水果”將DataFrame 分組:
df.groupby(['Name', 'Fruit'])
但是,這僅將資料分組,而不執行任何聚合。要計算每個組的“Number”總和,我們可以使用sum():
df.groupby(['Name', 'Fruit']).sum()
這將輸出一個具有分層索引的新DataFrame,其中第一級對應於“Name”,第二層對應“水果”。 「數字」欄包含每組的總和:
Number Name Fruit Bob Apples 16 Grapes 35 Oranges 67 Mike Apples 9 Oranges 57 Steve Apples 10 Tom Grapes 87 Oranges 15 Tony Grapes 15 Oranges 1
這給了我們期望的結果,顯示每個名稱購買的水果總數。
以上是如何使用 Pandas GroupBy 按名稱計算水果購買總量?的詳細內容。更多資訊請關注PHP中文網其他相關文章!