データ操作タスクでは、特定の基準に基づいて行をリストにグループ化することが一般的な要件です。 Pandas では、groupby 関数がこの目的のための強力なツールを提供します。
2 つの列 'a' と 'b' を持つ DataFrame があるとします。
a b A 1 A 2 B 5 B 5 B 4 C 6
目的は次のとおりです。 「a」列に基づいて行をグループ化し、グループごとに「b」列のリストを作成します。
これを実現するには、次のことができます。 groupby 関数を利用します:
df.groupby('a')['b'].apply(list)
groupby 関数は、「a」列ごとに DataFrame をグループ化します。次に、適用関数は各グループを反復処理し、list を使用して 'b' 列をリストに変換します。
結果の出力:
a A [1, 2] B [5, 5, 4] C [6] Name: b, dtype: object
この手法により、以下に基づいて行を効率的にグループ化できます。特定の列を選択し、各グループ内の他の列の値のリストを取得します。
以上がPandas の「groupby」関数はどのようにしてグループ化された行から値のリストを効率的に作成できるのでしょうか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。