Pandas でグループ化されたデータフレームに列を追加する方法
データ分析では、多くの場合、データをグループ化し、計算を実行する必要があります。各グループ。 Pandas は、groupby 関数を通じてこれを行う便利な方法を提供します。一般的なタスクの 1 つは、各グループ内の列の値をカウントし、これらのカウントを含む列をデータフレームに追加することです。
データフレーム df:
<code class="python">df = pd.DataFrame({'c':[1,1,1,2,2,2,2],'type':['m','n','o','m','m','n','n']})</code>
の値をカウントするには各 c の type を指定すると、グループ化されたデータフレームで value_counts 関数を使用できます。
<code class="python">g = df.groupby('c')['type'].value_counts().reset_index(name='t')</code>
これにより、グループ数を含む新しいデータフレーム g が作成されます。各グループのサイズを指定して g に列を追加するには、transform 関数を使用します。
<code class="python">g['size'] = df.groupby('c')['type'].transform('size')</code>
transform は、元のデータフレーム内の各グループに関数を適用し、インデックスが一致した Series を返します。元のデータフレーム。この場合、size 関数を使用して各グループ内の要素の数をカウントし、それを新しい列サイズに割り当てます。結果のデータフレーム g は次のようになります。
<code class="python"> c type t size 0 1 m 1 3 1 1 n 1 3 2 1 o 1 3 3 2 m 2 4 4 2 n 2 4</code>
これは、groupby 集計の結果に基づいて、グループ化されたデータフレームに新しい列を追加する簡単な方法を示しています。
以上がPandas でグループ化されたデータフレームにグループ数を含む列を追加する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。