特定の列でグループ化された一意の値をカウントすることは、データ分析の一般的なタスクです。 Pandas は、これを実現するためのさまざまなメソッドを提供します。
あなたの場合、「ID」列と「ドメイン」列を持つ DataFrame があり、「ドメイン」ごとに一意の「ID」値をカウントする必要があります。
df.groupby['domain', 'ID'].count()':
このメソッドは、'ID' グループと 'domain' グループの両方のカウントを含む DataFrame を返します。 。ただし、一意の 'ID' 値だけでなく、各グループの行数もカウントします。
nunique()' による解決策:
df.groupby ('domain')['ID'].nunique() は、各「ドメイン」グループの一意の「ID」数を計算します。結果のデータフレームには、インデックスとして「ドメイン」列が含まれ、新しい列としてカウントが含まれます。
一重引用符の削除:
「ドメイン」列に次の内容が含まれている場合一重引用符は、グループ化する前に df.domain.str.strip("'") を使用して削除します。
列名を保持:
「ID」を保持するには結果の列名には、df.groupby(by='domain', as_index=False).agg({'ID': pd.Series.nunique}) を使用します。これにより、「domain」列と「ID」(一意の数)列を持つ DataFrame が作成されます。
以上がPandas で列ごとにグループ化された一意の値を数える方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。