Ajout d'une nouvelle colonne à un DataFrame existant
Lorsque vous travaillez avec des DataFrames pandas, il devient souvent nécessaire d'ajouter de nouvelles colonnes aux dataframes existants. Il existe plusieurs approches pour y parvenir, chacune avec ses propres avantages et inconvénients.
1. Utilisation d'assign (recommandé pour Pandas 0.17 et supérieur) :
import pandas as pd import numpy as np # Generate a sample DataFrame df1 = pd.DataFrame({ 'a': [0.671399, 0.446172, 0.614758], 'b': [0.101208, -0.243316, 0.075793], 'c': [-0.181532, 0.051767, -0.451460], 'd': [0.241273, 1.577318, -0.012493] }) # Add a new column 'e' with random values sLength = len(df1['a']) df1 = df1.assign(e=pd.Series(np.random.randn(sLength)).values)
2. En utilisant loc[row_index, col_indexer] = value:
# Add a new column 'f' using loc df1.loc[:, 'f'] = pd.Series(np.random.randn(sLength), index=df1.index)
3. En utilisant df[new_column_name] = pd.Series(values, index=df.index):
# Add a new column 'g' using the old method df1['g'] = pd.Series(np.random.randn(sLength), index=df1.index)
N'oubliez pas que cette dernière méthode peut déclencher le SettingWithCopyWarning dans les versions plus récentes de pandas. L'utilisation d'assign ou de loc est généralement recommandée pour des raisons d'efficacité et de clarté.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!