Pandas の複数の列の値に基づいて新しい列を作成する
Pandas では、他の複数の列に存在する値。この機能は、複雑なロジックやカスタム関数を適用してデータから有意義な洞察を引き出す場合に役立ちます。
例として、6 つの民族性列の値に基づいて「race_label」というラベルの付いた新しい列を作成するタスクを考えてみましょう。 : ERI_Hispanic、ERI_AmerInd_AKNatv、ERI_Asian、ERI_Black_Afr.Amer、ERI_HI_PacIsl、およびERI_ホワイト。要件は、次の基準を使用して人種に基づいて個人を分類することです:
解決策
これを実現するには、カスタム関数と Pandas apply() 関数の両方を使用します。
カスタム関数を定義します:
def label_race(row): if row['eri_hispanic'] == 1: return 'Hispanic' if row['eri_afr_amer'] + row['eri_asian'] + row['eri_hawaiian'] + row['eri_nat_amer'] + row['eri_white'] > 1: return 'Two Or More' if row['eri_nat_amer'] == 1: return 'A/I AK Native' if row['eri_asian'] == 1: return 'Asian' if row['eri_afr_amer'] == 1: return 'Black/AA' if row['eri_hawaiian'] == 1: return 'Haw/Pac Isl.' if row['eri_white'] == 1: return 'White' return 'Other'
を使用してカスタム関数を適用します。 Pandas:
df['race_label'] = df.apply(label_race, axis=1)
これにより、Pandas データフレームに「race_label」という新しい列が作成されます。この列には、入力基準に基づいて各行の適切な分類が含まれます。
カスタム関数と Pandas apply() 関数を組み合わせることで、複数の列に適用される複雑なロジックから派生した新しい列を作成できます。効率的なデータ分析と解釈を促進します。
以上が複数の民族性列に基づいてパンダで新しい人種分類列を作成する方法は?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。