Dans l'analyse des données, il est souvent nécessaire de récupérer des lignes spécifiques d'un dataframe en fonction de critères prédéfinis. Pandas fournit diverses méthodes pour sous-ensembler des trames de données, y compris la possibilité de sélectionner des lignes en fonction d'une liste de valeurs.
Pour sous-ensembler une trame de données Pandas en fonction d'une liste de valeurs, vous pouvez utiliser la méthode isin(), comme démontré ci-dessous :
import pandas as pd # Create a Pandas dataframe df = pd.DataFrame({'A': [5, 6, 3, 4], 'B': [1, 2, 3, 5]}) # Define a list of values to filter by list_of_values = [3, 6] # Subset dataframe based on the list y = df[df['A'].isin(list_of_values)] print(y)
Sortie :
A B 1 6 2 2 3 3
La méthode isin() vous permet de filtrer les lignes où les valeurs de colonne spécifiées correspondent à n'importe quelle valeur de la liste fournie.
Dans certains scénarios, vous devrez peut-être exclure des lignes en fonction de la liste de valeurs. Pour y parvenir, vous pouvez utiliser l'opérateur ~ avec isin(), comme illustré ci-dessous :
import pandas as pd # Create a Pandas dataframe df = pd.DataFrame({'A': [5, 6, 3, 4], 'B': [1, 2, 3, 5]}) # Define a list of values to exclude list_of_values = [3, 6] # Subset dataframe excluding the list z = df[~df['A'].isin(list_of_values)] print(z)
Sortie :
A B 0 5 1 3 4 5
L'opérateur ~ annule la sélection, garantissant que les lignes dont les valeurs ne figurent pas dans la liste spécifiée sont affichées.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!