如何在 pandas DataFrame 中将一列中的文本拆分为多行?

Barbara Streisand
发布: 2024-11-10 20:55:02
原创
300 人浏览过

How do you split text in a column into multiple rows in a pandas DataFrame?

将列中的文本拆分为多行

在大型 csv 文件中,用户经常需要将列中的文本数据拆分为单独的行以便于分析和数据操纵。使用 pandas 或 Python 时,可以采用多种方法来实现此目标。

一种常见的方法是利用所需列上的 split 方法,根据指定的分隔符对文本进行细分。例如,要使用空格和冒号拆分名为“Seatblocks”的列,可以使用以下语法:

s = df['Seatblocks'].str.split(' ').apply(Series, 1).stack()
s.index = s.index.droplevel(-1)  # align with df's index
s.name = 'Seatblocks'  # assign a name for joining
登录后复制

拆分列后,可以使用 join 方法将其与原始 DataFrame 重新连接:

del df['Seatblocks']
df.join(s)
登录后复制

或者,要为每个冒号分隔的字符串创建单独的列,可以应用以下代码:

df.join(s.apply(lambda x: Series(x.split(':'))))
登录后复制

通过使用这些方法,用户可以有效地将文本数据拆分为多行,允许在编程工作中进行更精细的分析和数据操作。

以上是如何在 pandas DataFrame 中将一列中的文本拆分为多行?的详细内容。更多信息请关注PHP中文网其他相关文章!

来源:php.cn
本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
作者最新文章
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板