Numpy "où" avec plusieurs conditions
Dans le cadre de l'analyse de données, il est souvent nécessaire de définir des conditions personnalisées et d'attribuer en conséquence différentes valeurs basées sur ces conditions. La fonction « où » de Numpy peut être utilisée pour gérer de tels scénarios. Cependant, des défis surviennent lorsqu'il s'agit de conditions multiples.
Un cas spécifique consiste à essayer d'ajouter une nouvelle colonne « energy_class » à une trame de données « df_energy ». Les valeurs "energy_class" sont attribuées en fonction des conditions suivantes :
Le problème rencontré était que la fonction np.where ne prend généralement en charge que deux conditions.
Pour résoudre ce problème, la fonction "select" de numpy peut être utilisée. Voici un exemple :
<code class="python">col = 'consumption_energy' conditions = [ df2[col] >= 400, (df2[col] < 400) & (df2[col]> 200), df2[col] <= 200 ] choices = [ "high", 'medium', 'low' ] df2["energy_class"] = np.select(conditions, choices, default=np.nan)</code>
Cet extrait de code utilise "np.select" pour évaluer plusieurs conditions et attribuer des valeurs à partir de la liste de "choix" correspondante. Le paramètre "default" est utilisé pour gérer tous les cas qui ne remplissent pas les conditions spécifiées.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!