Création d'une colonne conditionnelle : If-Elif-Else dans Pandas
Le problème donné demande qu'une nouvelle colonne soit ajoutée à un DataFrame basée sur une série de critères conditionnels. Le défi réside dans la mise en œuvre de ces conditions tout en maintenant l'efficacité et la lisibilité du code.
Solution utilisant une application de fonction
Une approche consiste à créer une fonction qui mappe chaque ligne au résultat souhaité en fonction des conditions :
<code class="python">def f(row): if row['A'] == row['B']: return 0 elif row['A'] > row['B']: return 1 else: return -1 df['C'] = df.apply(f, axis=1)</code>
Cette méthode est lisible et facile à mettre en œuvre, mais elle n'est pas vectorisée et peut entraîner des problèmes de performances avec de grands ensembles de données.
Solution vectorisée
Pour plus d'efficacité, une approche vectorisée utilisant la fonction np.where de NumPy est recommandée :
<code class="python">df['C'] = np.where( df['A'] == df['B'], 0, np.where( df['A'] > df['B'], 1, -1))</code>
Cette opération effectue la sélection conditionnelle par élément sur le DataFrame, ce qui donne une nouvelle colonne avec les valeurs souhaitées.
Cette approche vectorisée offre des gains de performances significatifs par rapport à la méthode basée sur les fonctions. Cela permet également une mise en œuvre plus concise et lisible des critères conditionnels.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!