将函数应用于 Pandas Dataframe 的多列
情况如下:定义了一个函数和一个 dataframe,并且目标是将函数应用于数据帧的两个特定列以生成新列。但是,尝试将 apply 方法与该函数一起使用会导致错误。
要解决此问题,有多种方法:
带有列名的 Lambda 表达式
一个简洁易读的解决方案是在 apply 中使用 lambda 表达式方法:
df['col_3'] = df.apply(lambda x: get_sublist(x.col_1, x.col_2), axis=1)
此方法直接使用列名而不是数字索引,从而不易出错。
带有示例数据的示例
考虑示例数据:
df = pd.DataFrame({'ID':['1', '2', '3'], 'col_1': [0, 2, 3], 'col_2':[1, 4, 5]}) mylist = ['a', 'b', 'c', 'd', 'e', 'f']
运行前面的代码将生成一个新列, col_3,包含所需的结果:
ID col_1 col_2 col_3 0 1 0 1 [a, b] 1 2 2 4 [c, d, e] 2 3 3 5 [d, e, f]
非标准列名称的方括号
如果列名称包含空格或与现有数据框属性匹配,则使用方括号可以使用:
df['col_3'] = df.apply(lambda x: f(x['col 1'], x['col 2']), axis=1)
以上是如何将函数应用于多个 Pandas Dataframe 列并创建新列?的详细内容。更多信息请关注PHP中文网其他相关文章!