向现有 DataFrame 添加新列
在数据操作任务中,通常需要使用附加列来扩充现有 DataFrame。在这里,我们解决如何使用 Pandas 在 Python 中实现此目的的问题。
问题陈述
考虑以下具有索引列和非连续数字的行的 DataFrame :
a b c d 2 0.671399 0.101208 -0.181532 0.241273 3 0.446172 -0.243316 0.051767 1.577318 5 0.614758 0.075793 -0.451460 -0.012493
我们的目标是在不改变的情况下向此 DataFrame 添加一个新列“e”现有数据。新列应与 DataFrame 具有相同的长度。
解决方案
方法 1(分配):
将一系列值作为新列添加到 DataFrame 的最有效方法是使用 assign function:
df1 = df1.assign(e=pd.Series(np.random.randn(sLength)).values)
其中:
方法 2 (loc):
另一种方法是使用 loc 访问器来设置 new 的值column:
df1.loc[:,'f'] = pd.Series(np.random.randn(sLength), index=df1.index)
其中:
两种方法都有效地将所需的新列 'e' 添加到 DataFrame,保留现有数据.
以上是如何在 Python 中高效地向 Pandas DataFrame 添加新列?的详细内容。更多信息请关注PHP中文网其他相关文章!