Combiner des colonnes pour créer une nouvelle colonne de période dans un DataFrame Pandas
Dans les pandas, vous pouvez rencontrer des cas où vous devez combiner des colonnes pour créer une nouvelle colonne, représentant souvent une combinaison de leurs valeurs. Imaginons un scénario dans lequel vous disposez d'un DataFrame avec les colonnes « Année » et « trimestre », comme indiqué ci-dessous :
Year quarter 2000 q2 2001 q3
Vous souhaitez créer une nouvelle colonne nommée « période » qui combine les valeurs de « Année » " et " quarter ", ce qui donne un DataFrame qui ressemble à ceci :
Year quarter period 2000 q2 2000q2 2001 q3 2001q3
Combining String Colonnes
Si « Année » et « trimestre » sont des chaînes, vous pouvez les concaténer directement à l'aide de l'opérateur « » :
df["period"] = df["Year"] + df["quarter"]
Combinaison de colonnes non-chaînes
Si « Année » ou « trimestre » n'est pas une chaîne, vous devez la convertir en une chaîne en premier, comme démontré ci-dessous :
df["period"] = df["Year"].astype(str) + df["quarter"]
REMARQUE : Soyez prudent avec les valeurs NaN lors de l'exécution de cette opération.
Combinaison de plusieurs colonnes de chaîne à l'aide de agg
Si vous avez plusieurs colonnes de chaînes à combiner, vous pouvez utiliser la fonction 'agg' pour appliquer une jointure opération :
df['period'] = df[['Year', 'quarter', ...]].agg('-'.join, axis=1)
Dans ce cas, '-' est le séparateur utilisé pour concaténer les colonnes.
En suivant ces étapes, vous pouvez combiner efficacement des colonnes dans un DataFrame pandas pour créer un nouvelle colonne qui représente une combinaison de leurs valeurs.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!