Substitution inattendue avec re.sub et Flag
La documentation Python indique que l'indicateur re.MULTILINE permet au caractère caret (^) de match au début de chaque ligne. Cependant, lors de l'utilisation de cet indicateur avec re.sub, un comportement inattendu peut se produire.
Considérez cet exemple :
<code class="python">import re s = """// The quick brown fox. // Jumped over the lazy dog.""" result = re.sub('^//', '', s, re.MULTILINE) print(result)</code>
Le résultat attendu est que toutes les lignes commençant par "//" soient remplacé par une chaîne vide, ne laissant que :
The quick brown fox. Jumped over the lazy dog.
Cependant, le résultat réel est :
The quick brown fox. // Jumped over the lazy dog.
Raison du problème
Le problème se pose car la fonction re.sub accepte un quatrième argument pour le nombre maximum de substitutions à effectuer. Dans l'exemple, re.MULTILINE a été utilisé par erreur comme décompte plutôt que comme indicateur.
Solution
Pour corriger ce comportement, utilisez un argument nommé pour spécifier le flag:
<code class="python">result = re.sub('^//', '', s, flags=re.MULTILINE)</code>
Alternativement, vous pouvez compiler l'expression régulière avec le drapeau souhaité avant de l'utiliser avec re.sub:
<code class="python">regex = re.compile('^//', re.MULTILINE) result = re.sub(regex, '', s)</code>
En spécifiant correctement le drapeau re.MULTILINE, vous peut garantir que toutes les occurrences du motif ^// sont remplacées, quelle que soit leur position dans la chaîne.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!