Pandas での集計
質問 1: Pandas で集計を実行するにはどうすればよいですか?
答え:
- Pandas はさまざまな集約を提供しますsum()、mean()、count() などの関数。
- グループ全体のデータを要約するために集計を適用する前に、特定の列でグループ化します。
質問 2: いいえ集計後のDataFrame!何が起こったのでしょうか?
答え:
- 集計結果がシリーズになる場合は、reset_index() を使用します。
- MultiIndex シリーズの場合、map() または str.replace() を使用して平坦化します。 columns.
質問 3: 主に文字列の列を (リスト、タプル、区切り文字付きの文字列に) 集約するにはどうすればよいですか?
答え:
- リスト、タプル、またはセットを集計に渡しますfunction.
- カスタム集計には GroupBy.apply() を使用します。
- 区切り文字付きの文字列を作成するには、文字列列で .join() を使用します。
質問4: 集計するにはどうすればよいですかカウント?
答え:
- 各グループの項目数には GroupBy.size() を使用します。
- GroupBy.count を使用します。 () は各グループの非欠損値の数です。
- Series.value_counts() を使用します。シリーズ内の固有の値をカウントします。
質問 5: 集計された値を入力する新しい列を作成するにはどうすればよいですか?
答え:
- GroupBy.transform() を使用して各グループに集計関数を適用し、それに基づいて新しい列を生成します。結果。
以上がPandas を使用してデータを効果的に集約するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。