Scénarios d'application d'expressions régulières inversées dans le langage Go
Les expressions régulières, en tant que puissant outil de correspondance et de traitement de texte, ont été largement utilisées dans divers domaines. En tant que langage de programmation offrant une efficacité de développement élevée, une vitesse d'exécution rapide et une forte portabilité, le langage Go est également doté de son propre support pour les expressions régulières. Cependant, en plus des expressions régulières, le langage Go fournit également un autre outil puissant : les expressions régulières négatives. Discutons des scénarios d'application des expressions anti-régulières en langage Go.
Pendant le développement, la saisie de texte est souvent restreinte. Par exemple, seuls des caractères spécifiques tels que des chiffres et des lettres peuvent être saisis. Dans ce cas, vous pouvez utiliser des expressions régulières inverses pour y parvenir. Supposons que nous devions empêcher le texte saisi de contenir des caractères chinois, des signes de ponctuation et des espaces. Nous pouvons utiliser les expressions régulières suivantes pour la correspondance :
^[a-zA-Z0-9]*$
où "^" représente le début du texte, "$" représente la fin de. le texte, et "*" représente Correspond à n'importe quel nombre de caractères précédents, "[a-zA-Z0-9]" signifie correspondre à tous les chiffres et lettres. Si vous devez vérifier si le texte saisi est illégal, il vous suffit d'inverser cette expression régulière et vous pouvez obtenir l'expression régulière inverse suivante :
[^a-zA-Z0-9]+
où "[]" représente le jeu de caractères correspondant, "^" représente le négatif jeu de caractères et "+" Indique qu'il correspond à au moins un caractère précédent. La signification de cette expression régulière inverse est de faire correspondre tous les caractères qui ne sont ni des chiffres ni des lettres. Si vous utilisez cette expression régulière inverse pour faire correspondre du texte, tant qu'il peut être mis en correspondance, il peut être déterminé qu'il s'agit d'un caractère illégal.
Dans certains scénarios, vous devrez peut-être vérifier si le texte contient certains caractères. Si c'est le cas, effectuez un traitement spécifique, sinon ignorez-le. Par exemple, lors du traitement d'un texte HTML, vous devrez peut-être vérifier s'il contient du code Javascript. À ce stade, vous pouvez utiliser des expressions anti-régulières pour vérifier.
Supposons que nous voulions vérifier si le texte contient du code Javascript, nous pouvons utiliser l'expression anti-régulière suivante :
<script[^<]*(?:(?!</script>)<[^<]*)*</script>
La signification de cette expression anti-régulière est de faire correspondre tout ce qui commence par "