


Pourquoi les développeurs expérimentés n'utilisent jamais les regex pour la validation des e-mails ?
Dec 18, 2024 am 01:59 AMLe problème dont personne ne parle
Soyons réalistes : la validation des e-mails semble simple, mais c'est un piège technique qui attrape même les développeurs expérimentés.
Que se passe-t-il réellement ?
Imaginez que vous créez un formulaire d'inscription. Votre premier réflexe ? Lancez une expression régulière dans le champ de courrier électronique. Mauvais coup.
E-mails étranges valides réels
# These are ALL technically valid emails! valid_emails = [ '"J. R. \"Bob\" Dobbs"@example.com', 'admin@mailserver1', 'user+tag@gmail.com', 'postmaster@[123.123.123.123]' ]
La plupart des moteurs d'expressions régulières s'étoufferaient avec ceux-ci.
Pourquoi ?
Les normes de courrier électronique sont sauvages.
La plupart des développeurs seraient surpris d'apprendre qu'il s'agissait en fait d'une adresse e-mail techniquement valide selon la RFC 5322. La spécification permet :
- Pièces locales citées
- Commentaires entre parenthèses
- Commentaires imbriqués
- Caractères spéciaux dans les pièces locales
- Plusieurs étiquettes de domaine
Les coûts cachés d’une mauvaise validation
1. Perdre de vrais utilisateurs
Une expression régulière stricte peut rejeter des adresses e-mail parfaitement bonnes. Imaginez refuser un client potentiel parce que son e-mail semble « bizarre », comme si :
- Adressage Plus (user tags@gmail.com)
- Structures de domaines non conventionnelles
- Jeux de caractères internationaux
- Conventions de dénomination légitimes mais complexes
Votre équipe produit serait vraiment mécontente, de plus ; les ventes seraient vraiment énervées.
2. Attaques ReDoS
Les moteurs Regex utilisant le backtracking sont sensibles aux attaques par déni de service Regex (ReDoS).
def dangerous_regex_check(user_input): # This regex can destroy your server's performance evil_pattern = r'^(a+)+b$' return re.match(evil_pattern, user_input) # Just 30 characters can crash your system malicious_input = 'a' * 30 + 'b'
Les attaquants peuvent créer des entrées qui bloquent votre fonction de validation.
Une approche plus intelligente
Une validation de base qui fonctionne réellement
def smart_email_check(email): """Quick and dirty email sanity check""" return ( email and '@' in email and '.' in email.split('@')[1] and len(email) <= 254 # Email length limit )
La vraie solution : la vérification
- Vérification de la syntaxe de base
- Envoyer un lien de vérification
- Laissez l'utilisateur prouver que l'e-mail fonctionne
def validate_email(email): if not basic_email_check(email): return False # Send verification token token = generate_unique_token() send_verification_email(email, token) return True
Pro Tools pour les vrais développeurs
Au lieu d'écrire votre propre regex, utilisez des bibliothèques testées :
- Python : validateur d'e-mails
- JavaScript : validator.js
- Java : validateur Apache Commons
Une meilleure classe de validation
class EmailValidator: @staticmethod def validate(email): """ Smart email validation - Quick syntax check - Verify deliverability """ try: # Use a smart library validate_email( email, check_deliverability=True ) return True except EmailInvalidError: return False
L'essentiel
La validation des e-mails ne consiste pas à créer une forteresse incassable. Il s'agit de :
- Laisser entrer les vrais utilisateurs
- Garder votre système en sécurité
- Ne pas compliquer les choses
Points clés à retenir
- Oubliez les expressions régulières complexes
- Utilisez des bibliothèques éprouvées
- Envoyer des e-mails de vérification
- Soyez convivial
Les développeurs qui réussissent s'épargnent d'innombrables maux de tête.
Voulez-vous que je détaille davantage une partie de cela ?
Au fait, je travaille sur un outil contextuel illimité, où vous pouvez utiliser votre LLM préféré sans avoir besoin de donner le contexte encore et encore.
Regardez ceci, c'est entièrement gratuit pour les développeurs.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Article chaud

Outils chauds Tags

Article chaud

Tags d'article chaud

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Sujets chauds

Remplacer les caractères de chaîne en javascript

Tutoriel de configuration de l'API de recherche Google personnalisé

8 Superbes plugins de mise en page JQuery Page

Créez vos propres applications Web Ajax

Qu'est-ce que & # x27; ceci & # x27; en javascript?
