Comme toute base de données relationnelle, vous devrez peut-être sélectionner certaines lignes d'un DataFrame en fonction des valeurs d'une colonne particulière. Pour y parvenir de manière transparente dans Pandas, plusieurs méthodes sont à votre disposition.
Pour récupérer les lignes dont les valeurs de colonne correspondent à une valeur spécifique, utilisez l'opérateur == :
1 |
|
À l'inverse, si vous souhaitez sélectionner des lignes où les valeurs de colonne appartiennent à une collection de valeurs, utilisez isin :
1 |
|
Pour combiner plusieurs conditions dans votre sélection, connectez-les avec & :
1 |
|
Remarque : Les parenthèses sont ici cruciales pour garantir une évaluation correcte.
Pour exclure des lignes avec des valeurs de colonne spécifiques, utilisez !=:
1 |
|
Alternativement, pour les valeurs en dehors d'une certaine plage, annulez le résultat isin en utilisant ~:
1 |
|
Considérez ce qui suit DataFrame :
1 2 3 4 5 6 |
|
Sélection de lignes avec la valeur « A » « foo » :
1 |
|
Sélection de lignes avec les valeurs « B » « un » ou « trois » :
1 |
|
Pour les opérations de filtrage fréquentes, c'est plus efficace pour créer d'abord un index :
1 2 |
|
Vous pouvez également utiliser df.index.isin :
1 |
|
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!