Pourquoi les développeurs expérimentés n'utilisent jamais les regex pour la validation des e-mails ?-js tutoriel-php.cn

Maison

interface Web

js tutoriel

Pourquoi les développeurs expérimentés n'utilisent jamais les regex pour la validation des e-mails ?

Dec 18, 2024 am 01:59 AM

Le problème dont personne ne parle

Soyons réalistes : la validation des e-mails semble simple, mais c'est un piège technique qui attrape même les développeurs expérimentés.

Que se passe-t-il réellement ?

Imaginez que vous créez un formulaire d'inscription. Votre premier réflexe ? Lancez une expression régulière dans le champ de courrier électronique. Mauvais coup.

E-mails étranges valides réels

# These are ALL technically valid emails!
valid_emails = [
    '"J. R. \"Bob\" Dobbs"@example.com',
    'admin@mailserver1',
    'user+tag@gmail.com',
    'postmaster@[123.123.123.123]'
]

Copier après la connexion

La plupart des moteurs d'expressions régulières s'étoufferaient avec ceux-ci.

Pourquoi ?

Les normes de courrier électronique sont sauvages.

La plupart des développeurs seraient surpris d'apprendre qu'il s'agissait en fait d'une adresse e-mail techniquement valide selon la RFC 5322. La spécification permet :

Pièces locales citées
Commentaires entre parenthèses
Commentaires imbriqués
Caractères spéciaux dans les pièces locales
Plusieurs étiquettes de domaine

Les coûts cachés d’une mauvaise validation

1. Perdre de vrais utilisateurs

Une expression régulière stricte peut rejeter des adresses e-mail parfaitement bonnes. Imaginez refuser un client potentiel parce que son e-mail semble « bizarre », comme si :

Adressage Plus (user tags@gmail.com)
Structures de domaines non conventionnelles
Jeux de caractères internationaux
Conventions de dénomination légitimes mais complexes

Votre équipe produit serait vraiment mécontente, de plus ; les ventes seraient vraiment énervées.

2. Attaques ReDoS

Les moteurs Regex utilisant le backtracking sont sensibles aux attaques par déni de service Regex (ReDoS).

def dangerous_regex_check(user_input):
    # This regex can destroy your server's performance
    evil_pattern = r'^(a+)+b$'
    return re.match(evil_pattern, user_input)

# Just 30 characters can crash your system
malicious_input = 'a' * 30 + 'b'

Copier après la connexion

Les attaquants peuvent créer des entrées qui bloquent votre fonction de validation.

Une approche plus intelligente

Une validation de base qui fonctionne réellement

def smart_email_check(email):
    """Quick and dirty email sanity check"""
    return (
        email and 
        '@' in email and 
        '.' in email.split('@')[1] and
        len(email) &lt;= 254  # Email length limit
    )

Copier après la connexion

La vraie solution : la vérification

Vérification de la syntaxe de base
Envoyer un lien de vérification
Laissez l'utilisateur prouver que l'e-mail fonctionne

def validate_email(email):
    if not basic_email_check(email):
        return False

    # Send verification token
    token = generate_unique_token()
    send_verification_email(email, token)

    return True

Copier après la connexion

Pro Tools pour les vrais développeurs

Au lieu d'écrire votre propre regex, utilisez des bibliothèques testées :

Python : validateur d'e-mails
JavaScript : validator.js
Java : validateur Apache Commons

Une meilleure classe de validation

class EmailValidator:
    @staticmethod
    def validate(email):
        """
        Smart email validation
        - Quick syntax check
        - Verify deliverability
        """
        try:
            # Use a smart library
            validate_email(
                email, 
                check_deliverability=True
            )
            return True
        except EmailInvalidError:
            return False

Copier après la connexion

L'essentiel

La validation des e-mails ne consiste pas à créer une forteresse incassable. Il s'agit de :

Laisser entrer les vrais utilisateurs
Garder votre système en sécurité
Ne pas compliquer les choses

Points clés à retenir

Oubliez les expressions régulières complexes
Utilisez des bibliothèques éprouvées
Envoyer des e-mails de vérification
Soyez convivial

Les développeurs qui réussissent s'épargnent d'innombrables maux de tête.

Voulez-vous que je détaille davantage une partie de cela ?

Au fait, je travaille sur un outil contextuel illimité, où vous pouvez utiliser votre LLM préféré sans avoir besoin de donner le contexte encore et encore.

Regardez ceci, c'est entièrement gratuit pour les développeurs.

Why experienced developers never use regex for email validation?

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn