如何從分組的 Pandas DataFrame 中有效地提取字串並集?

Patricia Arquette
發布: 2024-10-25 05:48:29
原創
988 人瀏覽過

How to Efficiently Extract the Union of Strings from Grouped Pandas DataFrames?

Pandas GroupBy 中的字串並集

這個問題解決了一個常見的挑戰:從以特定分組的Pandas DataFrame 中提取字串並集柱子。不幸的是,在包含字串的列上使用 sum() 函數不會連接它們。相反,本文探討了實現所需結果的替代方法。

將 GroupBy 與自訂函數結合使用

一種解決方案是定義應用特定操作的自訂函數給每個群組。例如,我們可以使用 apply() 方法來迭代群組並傳回所需的值。運算方法如下:

<code class="python">def my_function(group):
    return "{%s}" % ', '.join(group['C'])</code>
登入後複製

此函數將每個群組的「C」欄位中的字串組合成一個用大括號括起來的集合。

<code class="python">df.groupby('A')['C'].apply(my_function)</code>
登入後複製

將GroupBy 與lambda 結合使用表達式

更簡單的語法涉及使用lambda 表達式:

<code class="python">df.groupby('A')['C'].apply(lambda x: "{%s}" % ', '.join(x))</code>
登入後複製

組合組

有時,將多組的資訊組合成一個系列可能會很有用。以下是範例:

此函數使用 sum() 聚合「A」和「B」列,並將「C」列組合成一個集合。

<code class="python">def f(group):
    return Series(dict(A=group['A'].sum(),
                       B=group['B'].sum(),
                       C="{%s}" % ', '.join(group['C'])))</code>
登入後複製

此方法產生一個包含每個群組的聚合值的 DataFrame。

<code class="python">df.groupby('A').apply(f)</code>
登入後複製
透過使用這些方法,您可以有效地從分組的 Pandas DataFrame 中提取字串的並集,從而解鎖以有意義的方式分析和視覺化基於文字的資料的能力.

以上是如何從分組的 Pandas DataFrame 中有效地提取字串並集?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

來源:php.cn
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
作者最新文章
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板
關於我們 免責聲明 Sitemap
PHP中文網:公益線上PHP培訓,幫助PHP學習者快速成長!