L'expression régulière est un puissant outil de correspondance de texte qui peut être utilisé dans différents langages de programmation ou éditeurs de texte. Dans le traitement de texte, les fonctions d'expression régulière nous permettent de faire correspondre et de filtrer facilement le contenu du texte et d'améliorer l'efficacité du traitement de texte.
Les fonctions d'expression régulière ont généralement des métacaractères et des symboles de base, tels que :
- (point) : correspond à n'importe quel caractère unique ; 🎜#^ (caret) : correspond au début de la ligne ;
- $ (signe dollar) : correspond à la fin de la ligne ;
- [] (jeu de caractères) : correspond au caractère N'importe quel caractère de l'ensemble ;
- d : correspond aux chiffres
- w : correspond aux lettres, aux chiffres ou aux traits de soulignement ; espaces ou espaces Symboles de tableau et autres caractères d'espacement.
- Voici quelques exemples d'applications pratiques des fonctions d'expressions régulières.
-
Extraire les numéros de téléphone d'un SMS
S'il y a un texte qui contient plusieurs numéros de téléphone, comme indiqué ci-dessous : - # 🎜🎜#Voici mon numéro de téléphone 123-456-7890, et l'autre numéro de téléphone est le 111-222-3333.
Nous pouvons utiliser la fonction d'expression régulière pour extraire ces numéros de téléphone, le code est le suivant :
import re
text = "这是我的电话号码 123-456-7890,另外一个电话号码是 111-222-3333。"
pattern = r"d{3}-d{3}-d{4}"
phone_numbers = re.findall(pattern, text)
print(phone_numbers)
Copier après la connexion
Dans le code ci-dessus, la bibliothèque d'expressions régulières de Python re est d'abord importée. Ensuite, un texte variable est défini et attribué au contenu du texte contenant le numéro de téléphone. Ensuite, un modèle d'expression régulière est défini, d{3}-d{3}-d{4} signifie correspondre au format du numéro de téléphone sous la forme xxx-xxx-xxxx. Enfin, utilisez la fonction re.findall pour rechercher tous les numéros de téléphone correspondant au modèle et stockez les résultats correspondants dans la variable phone_numbers. En exécutant le code ci-dessus, le résultat de sortie est ['123-456-7890', '111-222-3333'].
Déterminer si un morceau de texte est conforme au format de l'adresse e-mail
Les adresses e-mail contiennent généralement le format nom d'utilisateur@domaine, où le nom d'utilisateur est le nom d'utilisateur, domaine est le nom de domaine du serveur de messagerie. Voici un exemple pour déterminer si le format de l'adresse e-mail est correct :
import re
text = "我的邮箱是john@example.com。"
pattern = r"w+@w+.w+"
if re.search(pattern, text):
print(text + " 是一个有效的邮箱地址。")
else:
print(text + " 不是一个有效的邮箱地址。")
Copier après la connexion
- Dans le code ci-dessus, utilisez la fonction re.search pour trouver le contenu texte qui correspond au format de l'adresse e-mail. Le modèle d'expression régulière w+@w+.w+ est utilisé pour faire correspondre les adresses e-mail qui répondent aux exigences de format. Si un contenu textuel répondant aux critères est trouvé, le contenu textuel spécifié est généré comme une adresse e-mail valide.
L'utilisation de fonctions d'expression régulière peut considérablement améliorer l'efficacité et la précision du traitement de texte. Cependant, il convient de noter que la fonction d'expression régulière peut être affectée par l'encodage du texte, les habitudes linguistiques et d'autres facteurs, elle doit donc être ajustée et optimisée en fonction de la situation spécifique d'utilisation. Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!