複数のフィールドを順番にグループ化します。具体的なコード例が必要です。
データ処理と分析では、多くの場合、データをグループ化し、複数のフィールドのシーケンスに従う必要があります。操作は順番に実行されます。今日は、Python で pandas ライブラリを使用して複数フィールドの groupby 操作を実装する方法を紹介し、具体的なコード例を示します。
始める前に、pandas ライブラリをインストールしてインポートし、処理するデータをロードする必要があります。受注番号 (order_id)、製品名 (product_name)、顧客名 (customer_name)、販売量 (sales) などのフィールドを含む販売注文のデータ セットがあるとします。
まずは、groupby の基本的な使い方を学びましょう。 groupby 関数は、指定されたフィールドに従ってデータをグループ化し、GroupBy オブジェクトを返すことができます。さらに、GroupBy オブジェクトに対して、集計計算やデータのフィルタリングなどの一連の操作を実行できます。
import pandas as pd # 加载数据 data = pd.read_csv('sales_order.csv') # 根据"order_id"字段进行分组 grouped = data.groupby('order_id') # 对每组数据进行求和操作 result = grouped.sum() print(result)
上記のコードでは、まず pd.read_csv
関数を使用して「sales_order.csv」という名前の CSV ファイルをロードし、次に groupby
関数を使用します。 「order_id」フィールドにデータをグループ化します。次に、sum
関数を使用して各データ セットに対して合計演算を実行し、最終結果を取得します。
ただし、場合によっては、複数のフィールドに基づいてグループ化操作、つまり複数レベルのグループ化を順番に実行する必要があります。この状況では、groupby
関数を複数回呼び出すことでこれを実現できます。
以下は、「order_id」フィールドと「product_name」フィールドの両方でグループ化する例です。
# 根据"order_id"和"product_name"字段进行分组 grouped = data.groupby(['order_id', 'product_name']) # 对每组数据进行求和操作 result = grouped.sum() print(result)
グループ化するフィールド名をリストとして groupby に渡します。
関数を使用すると、複数フィールドのグループ化操作を実装できます。上記のコードでは、「order_id」フィールドと「product_name」フィールドに従ってグループ化し、データの各グループに対して合計演算を実行しました。
さらに、さまざまなフィールドに基づいてさまざまなグループ化方法を指定することもできます。たとえば、上記のコードでは、最初に「order_id」フィールドでグループ化し、次に「product_name」フィールドでグループ化することができます。この場合、groupby
関数を 2 回呼び出す必要があります。
次は例です。最初に「order_id」フィールドに従ってグループ化し、次に「product_name」フィールドに従ってグループ化します:
# 根据"order_id"字段进行分组 grouped = data.groupby('order_id') # 根据"product_name字段进行分组 result = grouped.groupby('product_name').sum() print(result)
このようにして、順序を達成できます。複数のフィールドのグループ操作が順番に実行され、データの各グループに対して集計計算が実行されます。上記のコードでは、最初に「order_id」フィールドに基づいてグループ化し、次に「product_name」フィールドに基づいてデータの各グループに基づいてグループ化し、最後にデータの各グループに対して合計演算を実行します。
要約すると、pandas ライブラリの groupby 関数を使用して、複数フィールドのグループ化操作を実装できます。単一フィールドのグループ化でも、複数フィールドの連続グループ化でも、簡単なコードで実現できます。これにより、データの処理と分析の作業が大幅に容易になります。
以上が複数のフィールドを順番にグループ化するの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。