Maison > développement back-end > Tutoriel Python > Comment sélectionner des lignes spécifiques dans un DataFrame Pandas en fonction des valeurs de colonne ?

Comment sélectionner des lignes spécifiques dans un DataFrame Pandas en fonction des valeurs de colonne ?

Patricia Arquette
Libérer: 2024-12-30 15:30:13
original
219 Les gens l'ont consulté

How to Select Specific Rows in a Pandas DataFrame Based on Column Values?

Sélection de lignes en fonction des valeurs de colonne dans Pandas

Dans Pandas, filtrer un DataFrame pour sélectionner des lignes spécifiques en fonction des valeurs de colonne peut être effectué à l'aide d'une combinaison d'opérateurs de comparaison et Indexation booléenne.

Comparaison des valeurs de colonne

Pour sélectionner les lignes auxquelles une valeur de colonne correspond une valeur scalaire spécifique, utilisez l'opérateur == :

df.loc[df['column_name'] == some_value]
Copier après la connexion

Pour sélectionner les lignes où une valeur de colonne se trouve dans une liste ou une autre valeur itérable, utilisez l'opérateur isin :

df.loc[df['column_name'].isin(some_values)]
Copier après la connexion

Combinaison de conditions

Plusieurs conditions peuvent être combinées à l'aide de l'opérateur & pour sélectionner les lignes qui satisfont toutes conditions :

df.loc[(df['column_name'] >= A) & (df['column_name'] <= B)]
Copier après la connexion

Notez que les parenthèses sont nécessaires pour garantir la bonne priorité des opérateurs.

Conditions négatives

Pour sélectionner les lignes qui ne correspondent pas à une certaine valeur ou qui ne sont pas dans une liste spécifique, annulez la condition en utilisant != ou ~:

df.loc[df['column_name'] != some_value]
df = df.loc[~df['column_name'].isin(some_values)] # In-place replacement requires `loc`
Copier après la connexion

Index Optimisation

Pour un filtrage efficace sur les critères fréquemment utilisés, il peut être intéressant de créer un index sur la colonne. Cela permet des recherches plus rapides à l'aide de df.loc :

df = df.set_index(['B'])
df.loc['one']
Copier après la connexion

Exemples

Considérez le DataFrame suivant :

df = pd.DataFrame({'A': ['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'foo'],
                   'B': ['one', 'one', 'two', 'three', 'two', 'two', 'one', 'three'],
                   'C': np.arange(8), 'D': np.arange(8) * 2})
Copier après la connexion

Pour sélectionner les lignes où la colonne « A » est égale à « foo' :

print(df.loc[df['A'] == 'foo'])
Copier après la connexion

Pour sélectionner les lignes dans lesquelles se trouve la colonne « B » ['un', 'trois'] :

print(df.loc[df['B'].isin(['one','three'])])
Copier après la connexion

Pour sélectionner les lignes où la colonne "B" est "un" ou "deux" :

df = df.set_index(['B'])
print(df.loc[df.index.isin(['one','two'])])
Copier après la connexion

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Derniers articles par auteur
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal