Filtrer un DataFrame Pandas par critères de sous-chaîne
Supposons que vous ayez un DataFrame avec une colonne contenant des valeurs de chaîne. Vous pourriez être amené à sélectionner des lignes en fonction de correspondances de chaînes partielles, comme si vous utilisiez l'idiome re.search(pattern, cell_in_question) dans les expressions régulières. Même si vous connaissez la syntaxe df[df['A'] == "hello world"], trouver un moyen d'y parvenir pour les correspondances de chaînes partielles, telles que "hello", peut s'avérer difficile.
La solution réside dans l'utilisation de méthodes de chaînes vectorisées, en particulier Series.str. En utilisant cette approche, vous pouvez effectuer l'opération suivante :
df[df['A'].str.contains("hello")]
Cette ligne de code renverra le sous-ensemble de lignes du DataFrame qui contiennent la sous-chaîne « bonjour » dans la colonne « A ». Il est important de noter que cette fonctionnalité est disponible dans la version 0.8.1 de Pandas et les versions ultérieures.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!