条件付きの値を含む新しい列の作成
データを分析する場合、値が以下に基づいて選択される新しい列を作成することが必要になる場合があります。既存の列。これにより、データを分類または変換して、さらに分析や視覚化を行うことができます。ここでは 2 つのアプローチを示します:
np.where 2 つの選択肢:
既存の列に基づいて 2 つの値のみを選択する必要がある場合は、np を使用できます。 .where関数。たとえば、データフレームに「Set=='Z'」の場合は「color='green'」、それ以外の場合は「color='red'」となる「color」列を作成するには、次のようにします。
df['color'] = np.where(df['Set']=='Z', 'green', 'red')
複数の条件の np.select:
値を選択するときに考慮する条件が 3 つ以上ある場合は、 np.select 関数。たとえば、複数の条件に基づいて「color」列を作成するには:
conditions = [ (df['Set'] == 'Z') & (df['Type'] == 'A'), (df['Set'] == 'Z') & (df['Type'] == 'B'), (df['Type'] == 'B')] choices = ['yellow', 'blue', 'purple'] df['color'] = np.select(conditions, choices, default='black')
np.where または np.select を使用すると、条件付きの値を持つ新しい列を簡単に作成でき、データ操作とデータからより深い洞察を可能にします。
以上がNumPy を使用して DataFrame に条件値を含む新しい列を作成するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。