Maison > développement back-end > Tutoriel Python > Comment puis-je vérifier efficacement plusieurs sous-chaînes dans une colonne Pandas DataFrame ?

Comment puis-je vérifier efficacement plusieurs sous-chaînes dans une colonne Pandas DataFrame ?

Patricia Arquette
Libérer: 2024-11-30 12:17:11
original
946 Les gens l'ont consulté

How Can I Efficiently Check for Multiple Substrings Within a Pandas DataFrame Column?

Test de la présence de sous-chaînes dans Pandas DataFrame à l'aide de plusieurs sous-chaînes

Dans pandas, combiner df.isin() et df[col].str. contain() pour vérifier si une chaîne contient une sous-chaîne dans une liste peut être fastidieux. Cet article propose une solution alternative utilisant des expressions régulières et la méthode str.contains().

Pour illustrer, considérons une série s contenant ['cat','hat','dog','fog',' animal de compagnie']. Pour rechercher tous les éléments contenant « og » ou « at », à l'exception de « pet », le code suivant peut être utilisé :

searchfor = ['og', 'at']
jointed_regex = '|'.join(searchfor)
s[s.str.contains(jointed_regex)]
Copier après la connexion

Le résultat sera :

0    cat
1    hat
2    dog
3    fog
dtype: object
Copier après la connexion

En joignant les sous-chaînes avec un '|' caractère, la méthode str.contains() peut effectivement correspondre à n'importe quelle sous-chaîne dans les éléments de chaîne.

Gestion des caractères spéciaux

Notez que lorsque vous traitez des sous-chaînes contenant des caractères spéciaux caractères, tels que $ ou ^, il est nécessaire de les échapper à l'aide de re.escape(). Cela garantit que les caractères sont interprétés littéralement pendant le processus de correspondance.

Par exemple, si la recherche contient ['money', 'x^y'] :

import re
safe_searchfor = [re.escape(m) for m in searchfor]
s[s.str.contains('|'.join(safe_searchfor))]
Copier après la connexion

Ce code échappe au caractères spéciaux et assure une correspondance précise des sous-chaînes.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Derniers articles par auteur
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal