Comprendre les expressions régulières de chaîne brute
Les expressions régulières en Python utilisent le caractère barre oblique inverse pour désigner des caractères ou des séquences spéciaux. Cependant, cela peut entrer en conflit avec l'utilisation par Python de barres obliques inverses pour échapper des caractères dans les chaînes. Pour résoudre ce problème, Python propose le concept de « chaînes brutes ».
Qu'est-ce qu'une expression régulière de chaîne brute ?
Une expression régulière de chaîne brute est un modèle d'expression régulière qui est entouré d'un préfixe "r" ou "R". Ce préfixe signifie que les barres obliques inverses du modèle ne doivent pas être interprétées comme des caractères d'échappement. Au lieu de cela, ils sont traités comme des caractères littéraux.
Comment une expression régulière de chaîne brute fait-elle correspondre les caractères ?
Même dans une expression régulière de chaîne brute, Python interprète spécialement certains caractères. Ceux-ci incluent :
Exemples
Pour faire correspondre un chaîne contenant littéralement un caractère barre oblique inverse, utilisez l'expression régulière de chaîne brute suivante :
import re pattern = r"\[regex]" regex = re.compile(pattern)
Pour faire correspondre un chaîne contenant un caractère de nouvelle ligne :
pattern = r"\n" regex = re.compile(pattern)
Pour faire correspondre un mot :
pattern = r"\w+" regex = re.compile(pattern)
En utilisant des chaînes brutes, vous pouvez créer des expressions régulières qui correspondent avec précision aux caractères spéciaux, tels que les nouvelles lignes, les tabulations et les jeux de caractères, même dans les situations où les barres obliques inverses seraient autrement interprétées comme des caractères d'échappement.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!