首页 > 后端开发 > Python教程 > 如何有效地将 Pandas DataFrame 中的字符串列拆分为两个新列?

如何有效地将 Pandas DataFrame 中的字符串列拆分为两个新列?

Mary-Kate Olsen
发布: 2024-12-24 12:55:14
原创
894 人浏览过

How to Efficiently Split a String Column in a Pandas DataFrame into Two New Columns?

如何将 Dataframe 字符串列拆分为两列?

TL;DR 版本:

对于有文本列的简单情况带有分隔符并想要创建两列,最简单的解决方案是:

df[['A', 'B']] = df['AB'].str.split(' ', n=1, expand=True)
登录后复制

详细信息:

Andy Hayden 的方法有效地展示了 str 的强大功能。 extract() 方法。但是,对于已知分隔符的简单分割,.str.split() 方法就足够了。它对字符串列(Series)进行操作并返回列表列(Series)。

列的 .str 属性允许我们将列中的每个元素视为字符串并有效地应用方法。它有一个索引接口,用于通过索引获取字符串的每个元素,使我们能够对从 .str.split() 返回的列表进行切片和切块。

Python 元组解包可用于创建两个单独的列列表使用:

df['A'], df['B'] = df['AB'].str.split('-', n=1).str
登录后复制

或者,可以利用 .str.split() 中的 Expand=True 参数直接生成两个columns:

df[['A', 'B']] = df['AB'].str.split('-', n=1, expand=True)
登录后复制

expand=True 版本在处理不同长度的分割时很有优势,因为它通过在缺少“分割”的列中插入 None 值来处理这种情况。

以上是如何有效地将 Pandas DataFrame 中的字符串列拆分为两个新列?的详细内容。更多信息请关注PHP中文网其他相关文章!

来源:php.cn
本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
作者最新文章
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板