从现有列中选择特定值来填充新列是常见的数据操作任务。让我们探索使用 Pandas 在 Python 中实现此目的的两种方法。
当只有两个选项可供选择时, np.where 函数是一个方便的选择。在提供的示例中,我们希望为 Set 列中等于“Z”和“红色”的值创建一个带有“绿色”的颜色列。
df['color'] = np.where(df['Set']=='Z', 'green', 'red')
对于有两个以上选择的场景,np.select 提供了更大的灵活性。让我们介绍一下颜色列的更多条件:
该场景的代码如下:
conditions = [ (df['Set'] == 'Z') & (df['Type'] == 'A'), (df['Set'] == 'Z') & (df['Type'] == 'B'), (df['Type'] == 'B')] choices = ['yellow', 'blue', 'purple'] df['color'] = np.select(conditions, choices, default='black')
这种方法可以轻松自定义要选择的条件和值,使得适合更复杂的场景。
以上是如何根据现有列的值在 Pandas 中创建新列?的详细内容。更多信息请关注PHP中文网其他相关文章!