Recherche de correspondances de chaînes partielles dans Pandas DataFrame
Filtrer un pandas DataFrame en fonction de critères de chaîne partielle est souvent une nécessité lorsqu'il s'agit de données texte. Cet article montre comment effectuer cette opération à l'aide de la puissante méthode Series.str.
Considérez un DataFrame avec une colonne de valeurs de chaîne. Pour filtrer les lignes en fonction des correspondances de chaînes partielles, utilisez la syntaxe suivante :
df[df['column_name'].str.contains("partial_string")]
La méthode str.contains() prend un modèle d'expression régulière et renvoie un DataFrame booléen indiquant si chaque cellule de la colonne spécifiée satisfait à la pattern.
Par exemple, pour rechercher toutes les lignes du DataFrame où la colonne de nom contient la sous-chaîne "John", utilisez ce qui suit code :
df[df['name'].str.contains("John")]
Cette méthode est compatible avec les versions pandas 0.8.1 et ultérieures, offrant un moyen efficace d'effectuer des correspondances de chaînes partielles dans vos opérations DataFrame.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!