Création d'une colonne conditionnelle basée sur plusieurs conditions
Comme mentionné dans le fil de discussion donné, la tâche à accomplir est de générer une nouvelle colonne dans un DataFrame basé sur des conditions spécifiques. Le DataFrame contient deux colonnes, « A » et « B », et la colonne souhaitée, « C », doit se voir attribuer des valeurs basées sur des comparaisons entre « A » et « B ».
Les conditions sont les suivantes :
Pour ce faire, une fonction Python peut être créée pour évaluer les conditions et attribuer la valeur appropriée à « C » pour chaque ligne du DataFrame. La méthode apply() peut être utilisée pour appliquer la fonction à chaque ligne, en passant l'argument 'axis=1' pour spécifier que la fonction doit opérer sur les lignes. Le code ci-dessous illustre cette approche :
<code class="python">def conditional_value(row): if row['A'] == row['B']: return 0 elif row['A'] > row['B']: return 1 else: return -1 df['C'] = df.apply(conditional_value, axis=1)</code>
Cette approche basée sur les fonctions fournit un moyen lisible et personnalisable de créer la colonne conditionnelle.
Alternativement, pour de meilleures performances sur de grands ensembles de données, un fichier vectorisé L'opération peut être utilisée :
<code class="python">df['C'] = np.where( df['A'] == df['B'], 0, np.where( df['A'] > df['B'], 1, -1))</code>
Ici, la fonction np.where() est utilisée pour évaluer les conditions et attribuer efficacement les valeurs correspondantes à 'C'.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!