Pandas を使用すると、さまざまな集計操作を実行して、次元を削減し、データを要約できます。
Pandas は多くの機能を提供します集計関数 (mean()、sum()、count()、min()、max() など)。これらの関数を使用して、各グループの概要統計を計算できます。例:
# Calculate mean of each group based on 'A' and 'B' columns df1 = df.groupby(['A', 'B']).mean() # Print the results print(df1)
複数の列に集計を適用すると、グループ化された列の数に応じて、結果のオブジェクトは Series または DataFrame になります。
DataFrame を取得するにはすべての列については、groupby 関数で as_index=False を使用します。
文字列列を集計するには、リスト、タプル、または結合操作を使用できます。
例:
# Convert 'B' column values to a list for each group df1 = df.groupby('A')['B'].agg(list).reset_index() # Combine 'B' column values into a string with separator for each group df2 = df.groupby('A')['B'].agg(','.join).reset_index()
それぞれの非欠損値をカウントするにはグループの場合は、GroupBy.count() を使用します。欠損値を含むすべての値をカウントするには、GroupBy.size() を使用します。
例:
# Count non-missing values in 'C' column for each group df1 = df.groupby('A')['C'].count().reset_index(name='COUNT') # Count all values in 'A' column for each group df2 = df.groupby('A').size().reset_index(name='COUNT')
transform() メソッドを使用して、集計値を含む新しい列を追加できます。 transform() 関数は、指定された操作を各グループに適用し、元のオブジェクトと同じサイズの新しいオブジェクトを返します。
例:
# Create a new 'C1' column with the sum of 'C' grouped by 'A' df['C1'] = df.groupby('A')['C'].transform('sum')
以上がPandas でデータ集約を実行するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。