Données de test :
Par exemple, pour les entrées de journal simples ci-dessus, nous souhaitons atteindre deux objectifs :
1. Filtrez les données sur le n°8 ;
2. Recherchez les entrées qui ne contiennent pas la chaîne robots.txt (tant que l'URL contient robots.txt, toutes seront filtrées ).
La syntaxe de l'anticipation est :
(?!匹配模式)
Atteignons d'abord le premier objectif : faire correspondre les éléments qui ne commencent pas par une chaîne spécifique.
Ici, nous voulons exclure une chaîne continue, donc le modèle de correspondance est très simple, qui est le 08/07/2009. L'implémentation est la suivante :
^(?!2009-07-08).*?$
En utilisant Expresso, on peut voir que les résultats filtrent bel et bien les données sur le n°8.
Ensuite, atteignons notre deuxième objectif : exclure les entrées contenant une chaîne spécifique.
D'après la façon dont nous l'avons écrit ci-dessus, j'y ai jeté un œil :
^.*?(?!robots\.txt).*?$
Cette expression régulière peut être décrite en langue vernaculaire : commencez par n'importe quel caractère, puis ne suivez pas la chaîne continue de robots.txt Puis suivi d'un nombre quelconque de caractères, la fin de la chaîne.
Exécutez le test et constatez que :
n'a pas obtenu l'effet souhaité. Pourquoi est-ce ? Déboguons l'expression régulière ci-dessus en ajoutant deux groupes de capture :
^(.*?)(?!robots\.txt)(.*?)$
Résultats des tests :
Nous voyons que, d'abord, le premier groupe ne correspondait à rien , mais le deuxième groupe correspondait à la chaîne entière. Revenons en arrière et analysons l'expression régulière tout à l'heure.
En fait, lorsque le moteur standard analyse la zone A, il a déjà commencé à effectuer le travail d'anticipation pour la zone B. À ce moment-là, il a été constaté que la correspondance était réussie lorsque la zone A était Null - .* initialement autorisée à correspondre aux caractères nuls, et la condition d'anticipation était remplie. La chaîne "2009" suivait immédiatement la zone A, pas les robots. Par conséquent, l’ensemble du processus de mise en correspondance correspond avec succès à toutes les entrées.
Après avoir analysé la raison, nous avons révisé l'expression régulière ci-dessus et déplacé .*? dans l'expression anticipée, comme suit :
^(?!.*?robots).*$
Résultat du test :
Tutoriel recommandé : Introduction au développement Java
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!