Comment additionner les lignes DataFrame pour des colonnes spécifiques dans Pandas
Lorsque vous travaillez avec des DataFrames, il peut y avoir des cas où nous devons ajouter un nouveau colonne qui représente la somme des valeurs de plusieurs colonnes existantes. Dans cette question, l'utilisateur rencontre un problème en essayant de créer une nouvelle colonne « e » qui additionne les valeurs des colonnes « a », « b » et « d » dans un DataFrame.
La valeur initiale de l'utilisateur l'approche utilisant df[['a', 'b', 'd']].map(sum) a échoué. Pour additionner correctement les lignes de colonnes spécifiques dans Pandas, nous pouvons utiliser la fonction sum() avec le paramètre axis défini sur 1. Cela signifie que nous voulons additionner les lignes plutôt que les colonnes.
df['e'] = df.sum(axis=1, numeric_only=True)
Dans Versions Pandas antérieures à 2.0, on peut simplement spécifier axis=1 sans numeric_only=True. Cependant, dans les versions ultérieures, les colonnes non numériques sont ignorées lorsque numeric_only=True est spécifié.
Si l'objectif est de additionner des colonnes spécifiques, nous pouvons créer une liste des colonnes souhaitées et utiliser sum() avec axis =1 pour calculer les sommes de lignes pour ce sous-ensemble de colonnes.
col_list = list(df) col_list.remove('d') df['e'] = df[col_list].sum(axis=1)
En suivant ces étapes, nous pouvons ajouter avec succès une nouvelle colonne « e » qui contient les sommes de lignes pour toute combinaison de colonnes numériques dans un DataFrame.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!