在 Pandas DataFrame 中拆分一列元组
在 Pandas DataFrame 中,将包含元组的列拆分为多个列是常见操作。为了实现这一点,可以采用以下方法:
使用 pd.DataFrame(col.tolist())
该方法将元组列转换为列表元组,然后从中创建一个新的数据框。新数据帧的索引与原始数据帧的索引匹配。
<code class="python">import pandas as pd # Create a dataframe with a column containing tuples df = pd.DataFrame({'a': [1, 2], 'b': [(1, 2), (3, 4)]}) # Split the 'b' column into 'b1' and 'b2' df[['b1', 'b2']] = pd.DataFrame(df['b'].tolist(), index=df.index) # Print the resulting dataframe print(df)</code>
输出:
a b b1 b2 0 1 (1, 2) 1 2 1 2 (3, 4) 3 4
注意:使用 df['b'].apply(pd.Series) 代替pd.DataFrame(df['b'].tolist(), index=df.index) 也有效。但是,它速度较慢并且需要更多内存。
以上是如何在 Pandas DataFrame 中将一列元组拆分为多列?的详细内容。更多信息请关注PHP中文网其他相关文章!