ID (id)、group (group) の列を含む DataFrame が与えられた場合)、用語 (用語) の目標は、ID と用語の一意の組み合わせごとに各用語の出現を効率的にカウントすることです。 group.
Pandas の強力な groupby 関数と size 関数を利用すると、ループに頼ることなくこれを達成できます。
これ操作により、用語を表す階層的な MultiIndex DataFrame が生成されます。カウント:
グループ term1 term2 term3
id
1 3 2 02 2 1 1
何百万行もの大規模なデータセットであっても、このベクトル化されたアプローチは優れたパフォーマンスを示します。
以上がPandas で ID とグループごとに用語の出現を効率的にカウントするにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。