如何将数据帧字符串列拆分为两列?
在数据分析领域,遇到带有字符串列的数据帧需要被分裂是常有的事。为了实现这一壮举,出现了两个基本问题:
解决方案在于 pandas Series 的多功能 str 属性,特别是它的索引接口:
df['AB'].str[0] # accesses the first element of each string df['AB'].str[1] # accesses the second element of each string
通过利用这个索引接口和元组解包,我们可以使用拆分元素创建新列:
df['A'], df['B'] = df['AB'].str.split('-').str
或者,Pandas 提供了一个方便的内置方法, str.split(),用于分割字符串并自动返回一系列列表:
df['AB_split'] = df['AB'].str.split('-')
展开此列表分成单独的列,我们使用expand=True参数:
df[['A', 'B']] = df['AB'].str.split(' ', n=1, expand=True)
对于不同分割长度的情况,expand=True可以优雅地处理它,确保列长度一致:
df.join(df['AB'].str.split('-', expand=True).rename(columns={0:'A', 1:'B', 2:'C'}))
通过这些技术,Pandas 使您能够有效地拆分字符串列并重组数据框,以满足您的特定分析需求。
以上是如何将 Pandas DataFrame 字符串列拆分为多个列?的详细内容。更多信息请关注PHP中文网其他相关文章!