如何从 Pandas 中的函数高效创建多个新列?

Linda Hamilton
发布: 2024-10-28 20:58:02
原创
213 人浏览过

How to Efficiently Create Multiple New Columns from a Function in Pandas?

使用 Pandas 从函数创建多个新列

在 Pandas 中,您可能会遇到需要根据应用于某个函数的自定义函数创建多个新列的情况现有专栏。该任务可能看起来很简单,但由于函数的预期返回类型,可能会出现意想不到的挑战。

原始方法:分配到索引范围

最初,您可能会尝试分配使用 df.ix[: ,10:16] = df.textcol.map(extract_text_features) 语法直接连接到 DataFrame 中一系列索引的函数。然而,由于函数的返回类型不兼容,这种方法通常会导致错误。

可迭代解决方案

一个潜在的解决方案是使用 df.iterrows( 迭代 DataFrame 的每一行) )。此方法允许您将函数单独应用于每一行并将结果捕获为元组。然而,这种方法可能比其他选项慢得多。

使用 zip()

更高效、更灵活的方法是使用 zip() 函数与 map() 结合使用来创建新的专栏。 zip() 函数将函数的输出组合成一个元组,然后可以将其解压缩到各个列中。例如,以下代码演示了如何使用 zip() 方法创建六个新列:

<code class="python">df['p1'], df['p2'], df['p3'], df['p4'], df['p5'], df['p6'] = zip(*df['num'].map(powers))</code>
登录后复制

改进的 DataFrame 方法

Pandas 的最新更新引入了更方便的应用函数的方法到列并创建新列。例如,df.apply() 方法允许您指定输出格式(DataFrame、Series 或列表)并处理其他参数。此外,df.assign() 方法使您能够直接创建新列,而无需显式分配输出。这些较新的方法在基于函数创建多个新列方面提供了更大的灵活性和效率。

以上是如何从 Pandas 中的函数高效创建多个新列?的详细内容。更多信息请关注PHP中文网其他相关文章!

来源:php.cn
本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
作者最新文章
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板