Simulation de IN/NOT IN de SQL avec la méthode isin() de Pandas
Dans l'analyse de données, il est courant d'avoir besoin de filtrer un DataFrame basé sur un ensemble de valeurs, semblable aux opérateurs SQL IN et NOT IN. Pandas propose une solution simple avec la méthode isin().
La méthode isin() fonctionne sur la série Pandas et teste si chaque élément de la série est contenu dans une liste ou un ensemble spécifié. Pour répliquer le IN de SQL, appliquez simplement isin(list) à la colonne souhaitée :
>>> countries_to_keep = ['UK', 'China'] >>> df.country.isin(countries_to_keep)
Pour NOT IN, utilisez l'opérateur de négation (~) :
>>> df[~df.country.isin(countries_to_keep)]
L'isin() Cette méthode simplifie le filtrage des données, éliminant ainsi le besoin d'opérations de fusion fastidieuses, comme le montre l'exemple de code initial. Sa syntaxe reflète IN/NOT IN de SQL, ce qui la rend facile à intégrer dans votre flux de travail Pandas.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!