在大型 csv 文件中,用户经常需要将列中的文本数据拆分为单独的行以便于分析和数据操纵。使用 pandas 或 Python 时,可以采用多种方法来实现此目标。
一种常见的方法是利用所需列上的 split 方法,根据指定的分隔符对文本进行细分。例如,要使用空格和冒号拆分名为“Seatblocks”的列,可以使用以下语法:
s = df['Seatblocks'].str.split(' ').apply(Series, 1).stack() s.index = s.index.droplevel(-1) # align with df's index s.name = 'Seatblocks' # assign a name for joining
拆分列后,可以使用 join 方法将其与原始 DataFrame 重新连接:
del df['Seatblocks'] df.join(s)
或者,要为每个冒号分隔的字符串创建单独的列,可以应用以下代码:
df.join(s.apply(lambda x: Series(x.split(':'))))
通过使用这些方法,用户可以有效地将文本数据拆分为多行,允许在编程工作中进行更精细的分析和数据操作。
以上是如何在 pandas DataFrame 中将一列中的文本拆分为多行?的详细内容。更多信息请关注PHP中文网其他相关文章!