向現有 DataFrame 新增欄位
使用 pandas DataFrame 時,通常需要在現有 DataFrame 中新增列。有多種方法可以實現這一目標,每種方法都有自己的優點和缺點。
1.使用分配(建議 Pandas 0.17 以上版本):
import pandas as pd import numpy as np # Generate a sample DataFrame df1 = pd.DataFrame({ 'a': [0.671399, 0.446172, 0.614758], 'b': [0.101208, -0.243316, 0.075793], 'c': [-0.181532, 0.051767, -0.451460], 'd': [0.241273, 1.577318, -0.012493] }) # Add a new column 'e' with random values sLength = len(df1['a']) df1 = df1.assign(e=pd.Series(np.random.randn(sLength)).values)
2.使用 loc[row_index, col_indexer] = value:
# Add a new column 'f' using loc df1.loc[:, 'f'] = pd.Series(np.random.randn(sLength), index=df1.index)
3.使用df[new_column_name] = pd.Series(values, index=df.index):
# Add a new column 'g' using the old method df1['g'] = pd.Series(np.random.randn(sLength), index=df1.index)
請記住,後一種方法可能會在較新版本的pandas中觸發SettingWithCopyWarning。為了提高效率和清晰度,通常建議使用 allocate 或 loc。
以上是如何有效地向 Pandas DataFrame 新增列?的詳細內容。更多資訊請關注PHP中文網其他相關文章!