Ajout d'une nouvelle colonne à un DataFrame existant
Dans les tâches de manipulation de données, il est souvent nécessaire d'augmenter les DataFrames existants avec des colonnes supplémentaires. Ici, nous abordons la question de savoir comment y parvenir en Python à l'aide de Pandas.
Énoncé du problème
Considérez le DataFrame suivant avec des colonnes et des lignes indexées avec des nombres non continus :
a b c d 2 0.671399 0.101208 -0.181532 0.241273 3 0.446172 -0.243316 0.051767 1.577318 5 0.614758 0.075793 -0.451460 -0.012493
Notre objectif est d'ajouter une nouvelle colonne, 'e', à ce DataFrame sans altérer l'existant données. La nouvelle colonne doit avoir la même longueur que le DataFrame.
Solution
Méthode 1 (attribuer) :
Le La méthode la plus efficace pour ajouter une série de valeurs en tant que nouvelle colonne à un DataFrame consiste à utiliser assign function :
df1 = df1.assign(e=pd.Series(np.random.randn(sLength)).values)
où :
Méthode 2 (loc):
Une autre méthode consiste à utiliser l'accesseur loc pour définir les valeurs de la nouvelle colonne :
df1.loc[:,'f'] = pd.Series(np.random.randn(sLength), index=df1.index)
où :
Les deux méthodes ajoutent efficacement la nouvelle colonne souhaitée 'e' au DataFrame, préservant les données existantes.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!