既存の列から特定の値を選択して新しい列を作成します。一般的なデータ操作タスク。 Pandas を使用して Python でこれを実現する 2 つのアプローチを検討してみましょう。
選択できるオプションが 2 つしかない場合の場合は、np.where 関数が便利です。提供されている例では、「Z」に等しい Set 列の値に対して「緑」、それ以外の場合「赤」を含むカラー列を作成したいと考えています。
df['color'] = np.where(df['Set']=='Z', 'green', 'red')
選択肢が 3 つ以上あるシナリオの場合、np.select を使用すると柔軟性が高まります。 color 列にさらに条件を導入しましょう: (df['Set'] == 'Z') & (df['Type'] == 'A') の場合は
このシナリオのコードは次のとおりです。
conditions = [ (df['Set'] == 'Z') & (df['Type'] == 'A'), (df['Set'] == 'Z') & (df['Type'] == 'B'), (df['Type'] == 'B')] choices = ['yellow', 'blue', 'purple'] df['color'] = np.select(conditions, choices, default='black')
このアプローチにより、選択する条件と値を簡単にカスタマイズできます。より複雑なシナリオに適しています。
以上が既存の列の値に基づいて Pandas で新しい列を作成するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。