Maison > développement back-end > Tutoriel Python > Comment sélectionner des lignes spécifiques dans les DataFrames Pandas en fonction des valeurs de colonne ?

Comment sélectionner des lignes spécifiques dans les DataFrames Pandas en fonction des valeurs de colonne ?

Susan Sarandon
Libérer: 2024-12-26 13:20:10
original
318 Les gens l'ont consulté

How to Select Specific Rows in Pandas DataFrames Based on Column Values?

Sélection de lignes en fonction des valeurs de colonne dans les Pandas DataFrames

Lorsque vous travaillez avec des Pandas DataFrames, il est souvent nécessaire de filtrer les lignes en fonction de valeurs spécifiques dans une colonne particulière. Cela imite les requêtes SQL où les lignes sont récupérées à l'aide de filtres tels que WHERE column_name = some_value.

Valeurs scalaires

Pour sélectionner les lignes où une valeur de colonne correspond à une valeur scalaire, some_value, utilisez l'opérateur d'égalité == :

df.loc[df['column_name'] == some_value]
Copier après la connexion

Valeurs itérables

Pour sélectionner des lignes où une valeur de colonne se trouve dans un tableau, some_values, utilisez la méthode isin :

df.loc[df['column_name'].isin(some_values)]
Copier après la connexion

Combinaison de conditions

Plusieurs conditions peuvent être combinées à l'aide de l'opérateur logique & :

df.loc[(df['column_name'] >= A) & (df['column_name'] <= B)]
Copier après la connexion

Remarque : Utilisez des parenthèses pour garantir que la priorité des opérateurs est correct.

Négations

Pour sélectionner les lignes où la valeur d'une colonne n'est pas égale à some_value, utilisez l'opérateur d'inégalité !=:

df.loc[df['column_name'] != some_value]
Copier après la connexion

Pour isin, annulez le résultat en utilisant ~ :

df = df.loc[~df['column_name'].isin(some_values)]
Copier après la connexion

Exemples

Considérez ce qui suit DataFrame :

import pandas as pd

df = pd.DataFrame({'A': ['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'foo'],
                   'B': ['one', 'one', 'two', 'three', 'two', 'two', 'one', 'three'],
                   'C': np.arange(8),
                   'D': np.arange(8) * 2})
print(df)
Copier après la connexion

Sélectionnez les lignes où A est foo :

print(df.loc[df['A'] == 'foo'])
Copier après la connexion

Sélectionnez les lignes où B vaut un ou trois :

print(df.loc[df['B'].isin(['one', 'three'])])
Copier après la connexion

Créez un index et sélectionnez des lignes en utilisant it :

df = df.set_index(['B'])
print(df.loc['one'])
Copier après la connexion

Sélectionnez des lignes avec plusieurs valeurs indexées :

print(df.loc[df.index.isin(['one', 'two'])])
Copier après la connexion

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Derniers articles par auteur
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal