Création de colonnes conditionnelles basées sur les valeurs de colonnes existantes
Dans l'analyse des données, il est souvent nécessaire de créer de nouvelles colonnes dont les valeurs sont déterminées en fonction de conditions dérivé de colonnes existantes. Considérez le scénario dans lequel vous disposez d'un DataFrame avec deux colonnes : "Type" et "Set" et vous souhaitez ajouter une nouvelle colonne appelée "color" qui suit des règles spécifiques.
Ajout d'une colonne de couleur Basé sur les valeurs définies
Pour créer une colonne "couleur" où les valeurs sont "vertes" si "Set" est "Z" et "rouge" sinon, vous pouvez utiliser ce qui suit approche :
import numpy as np df['color'] = np.where(df['Set'] == 'Z', 'green', 'red')
Ce code utilise la fonction np.where, qui sélectionne les valeurs en fonction d'une condition. Si la valeur de la colonne « Définir » est « Z », la valeur « couleur » devient « vert » ; sinon, il devient « rouge ».
Utilisation de np.select pour des conditions plus complexes
Pour des scénarios plus complexes où vous avez plusieurs conditions, vous pouvez utiliser np.select . Par exemple, supposons que vous souhaitiez attribuer des couleurs selon les règles suivantes :
conditions = [ (df['Set'] == 'Z') & (df['Type'] == 'A'), (df['Set'] == 'Z') & (df['Type'] == 'B'), (df['Type'] == 'B')] choices = ['yellow', 'blue', 'purple'] df['color'] = np.select(conditions, choices, default='black')
La fonction np.select prend une liste de conditions et une liste de choix correspondante. Si la condition est remplie, le choix associé est sélectionné ; sinon, la valeur par défaut est utilisée.
Ces méthodes offrent des options polyvalentes pour créer des colonnes conditionnelles basées sur les valeurs de colonnes existantes, vous permettant ainsi de manipuler et d'analyser efficacement vos données.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!