Cet article présente principalement la méthode preg_replace() pour remplacer régulièrement toutes les chaînes qualifiées en PHP. Elle a une certaine valeur de référence. Maintenant, je la partage avec vous. Les amis dans le besoin peuvent s'y référer
PHP preg_replace. () le remplacement régulier est différent du remplacement régulier Javascript. PHP preg_replace() remplace par défaut tous les éléments dont les symboles correspondent aux conditions
Les données que nous devons traiter avec des programmes ne sont pas toujours conçues à l'avance avec une réflexion sur la base de données. En d’autres termes, il ne peut pas être stocké à l’aide de la structure de la base de données.
Par exemple, les modèles d'analyse du moteur de modèles, le filtrage des informations sensibles au spam, etc.
Généralement dans ce cas, nous utilisons des expressions régulières pour faire correspondre preg_match et remplacer preg_replace selon nos règles.
Mais dans les applications générales, elles ne sont rien de plus que du CRUD de base de données, et il y a très peu de possibilités de jouer avec les expressions régulières.
D'après ce qui a été dit précédemment, il existe deux scénarios : l'analyse statistique, par appariement, par remplacement ;
Remplacement régulier PHP preg_replace(), différent du remplacement régulier Javascript, PHP preg_replace() remplace par défaut tous les éléments dont les symboles correspondent aux conditions.
preg_replace (正则表达式, 替换成, 字符串, 最大替换次数【默认-1,无数次】, 替换次数)
Les expressions régulières dans la plupart des langues sont similaires, mais il existe des différences subtiles.
Expression régulière PHP
Caractères réguliers | Explication régulière |
---|---|
Marquer le caractère suivant comme caractère spécial, Ou un caractère littéral, une référence arrière ou un caractère d'échappement octal. Par exemple, « n » correspond au caractère « n ». "\n" correspond à un caractère de nouvelle ligne. La séquence "\" correspond à "" et "(" correspond à "(". | |
^ | correspond au début de la chaîne d'entrée. Si l'objet RegExp est défini Attribut multiligne, ^ correspond également à la position après "n" ou "r" |
$ | correspond à la position de fin de la chaîne d'entrée s'il est défini. correspond également à la position avant "n" ou "r". |
* | correspond à la sous-expression précédente zéro ou plusieurs fois zo* peut correspondre à "z" et ". zoo". *Équivalent à {0,} |
correspond à la sous-expression précédente une ou plusieurs fois. . Par exemple, "zo+" peut correspondre à "zo", mais pas à "z". . + est équivalent à {1,} | ? | <🎜 > Correspond à la sous-expression précédente zéro ou une fois. Par exemple, « do(es) ? » " dans "fait". ? équivaut à {0,1}. 🎜>
n est un entier non négatif qui correspond à un certain nombre de fois. Par exemple , "o{2}" ne peut pas correspondre au "o" dans "Bob", cependant. Peut correspondre à deux o dans "food". entier négatif. Par exemple, "o{. 2,}" ne peut pas correspondre au "o" dans "Bob", mais il peut correspondre à tous les o dans "foooood". "o{1,}" est équivalent à "o+". "o{0,}" est équivalent à "o*". ;=m correspond au moins n fois. Par exemple, "o{1,3}" correspondra aux trois premiers o de "fooooood". . Notez la virgule et les deux chiffres Il ne peut y avoir d'espaces entre | |
lorsque ce caractère est suivi d'un autre limiteur (*,+,?, {n},{n, }, {n,m}), le mode de correspondance est non gourmand. Le mode non gourmand correspond le moins possible à la chaîne recherchée, tandis que le mode gourmand par défaut correspond à la plus grande partie de la chaîne recherchée. chaîne autant que possible. Par exemple, pour la chaîne "oooo", "o?" correspondra à un seul "o", tandis que "o+" correspondra à tous les "o" | |
correspondent. N'importe quel caractère sauf "n". Pour faire correspondre n'importe quel caractère incluant "n", utilisez un modèle comme "[sS]" | (motif)<. 🎜> Faites correspondre le modèle et obtenez cette correspondance. La correspondance obtenue peut être obtenue à partir de la collection Matches générée, en utilisant la collection SubMatches dans VBScript et l'attribut $0...$9 dans JScript. Pour faire correspondre les caractères entre parenthèses, utilisez "(" ou ")". |
(?:pattern) | correspond au modèle mais n'obtient pas le résultat correspondant, ce qui signifie qu'il s'agit d'une correspondance non obtenue et n'est pas stockée pour une utilisation ultérieure. Ceci est utile lors de la combinaison de parties d'un motif à l'aide du caractère ou "(|)". Par exemple, « industr(?:y|ies) » est une expression plus simple que « industry|industries ». |
(?=motif) | Recherche positive positive, correspondant à la chaîne de recherche au début de tout modèle de correspondance de chaîne. Il s'agit d'une correspondance sans récupération, c'est-à-dire qu'il n'est pas nécessaire de récupérer la correspondance pour une utilisation ultérieure. Par exemple, « Windows(?=95|98|NT|2000) » peut correspondre à « Windows » dans « Windows2000 », mais ne peut pas correspondre à « Windows » dans « Windows3.1 ». La prélecture ne consomme pas de caractères, c'est-à-dire qu'après une correspondance, la recherche de la correspondance suivante commence immédiatement après la dernière correspondance, plutôt qu'après le caractère contenant la prélecture. |
(?!modèle) | Recherche négative directe, faisant correspondre la chaîne de recherche au début de toute chaîne qui ne correspond pas au modèle. Il s'agit d'une correspondance sans récupération, c'est-à-dire qu'il n'est pas nécessaire de récupérer la correspondance pour une utilisation ultérieure. Par exemple, « Windows(?!95|98|NT|2000) » peut correspondre à « Windows » dans « Windows3.1 », mais ne peut pas correspondre à « Windows » dans « Windows2000 ». |
(?<=motif) | La pré-vérification positive inversée est similaire à la pré-vérification positive avant, mais dans la direction opposée. Par exemple, "(?<=95|98|NT|2000)Windows" peut correspondre à "Windows" dans "2000Windows", mais ne peut pas correspondre à "Windows" dans "3.1Windows". |
(?La pré-vérification négative inversée est similaire à la pré-vérification négative avant, mais dans la direction opposée. Par exemple, "(? | |
x|y | correspond à x ou y. Par exemple, « z|food » correspond à « z » ou « food ». "(z|f)ood" correspond à "zood" ou "food". |
[xyz] | jeu de caractères. Correspond à l'un des caractères contenus. Par exemple, « [abc] » correspondrait au « a » dans « plain ». |
[^xyz] | Un ensemble de caractères de valeur négative. Correspond à n’importe quel caractère non inclus. Par exemple, "[^abc]" correspondrait à "plin" dans "plain". |
[a-z] | plage de caractères. Correspond à n’importe quel caractère dans la plage spécifiée. Par exemple, "[a-z]" correspond à n'importe quel caractère alphabétique minuscule compris entre "a" et "z". Remarque : Ce n'est que lorsque le trait d'union se trouve à l'intérieur du groupe de caractères et entre deux caractères qu'il peut représenter la plage de caractères ; s'il apparaît au début du groupe de caractères, il ne peut représenter que le trait d'union lui-même |
Plage de caractères négative. Correspond à tout caractère ne se trouvant pas dans la plage spécifiée. Par exemple, "[^a-z]" correspond à tout caractère qui n'est pas compris entre "a" et "z". | |
correspond à une limite de mot, qui fait référence à la position entre un mot et un espace. Par exemple, « erb » peut correspondre au « er » dans « never » mais pas au « er » dans « verb ». | |
correspond aux limites autres que les mots. "erB" correspond au "er" dans "verb", mais pas au "er" dans "jamais". | |
correspond au caractère de contrôle spécifié par x. Par exemple, cM correspond à un caractère Control-M ou à un retour chariot. La valeur de x doit être A-Z ou a-z. Sinon, traitez c comme un caractère « c » littéral. | |
correspond à un caractère numérique. Équivalent à [0-9]. | |
correspond à un caractère non numérique. Équivalent à [^0-9]. | |
correspond à un saut de formulaire. Équivalent à x0c et cL. | |
correspond à un caractère de nouvelle ligne. Équivalent à x0a et cJ. | |
correspond à un caractère de retour chariot. Équivalent à x0d et cM. | |
correspond à n'importe quel caractère d'espacement, y compris les espaces, les tabulations, les sauts de formulaire, etc. Équivalent à [fnrtv]. | |
correspond à tout caractère autre qu'un espace. Équivalent à [^ fnrtv]. | |
correspond à un caractère de tabulation. Équivalent à x09 et cI. | |
correspond à un caractère de tabulation verticale. Équivalent à x0b et cK. | |
correspond à n'importe quel caractère de mot, y compris un trait de soulignement. Équivalent à "[A-Za-z0-9_]". | |
correspond à n'importe quel caractère autre qu'un mot. Équivalent à "[^A-Za-z0-9_]". | |
correspond à n, où n est la valeur d'échappement hexadécimale. La valeur d’échappement hexadécimale doit comporter exactement deux chiffres. Par exemple, « x41 » correspond à « A ». "x041" équivaut à "x04&1". Le codage ASCII peut être utilisé dans les expressions régulières. | |
correspond à num, où num est un entier positif. Une référence au match obtenu. Par exemple, "(.)1" correspond à deux caractères identiques consécutifs. | |
identifie une valeur d'échappement octale ou une référence arrière. n est une référence vers l'arrière si n est précédé d'au moins n sous-expressions récupérées. Sinon, si n est un nombre octal (0-7), alors n est une valeur d'échappement octale. | |
Identifie une valeur d'échappement octale ou une référence arrière. Si nm est précédé d'au moins nm get sous-expressions, nm est une référence vers l'arrière. Si nm est précédé d'au moins n, alors n est une référence vers l'arrière suivie du littéral m. Si aucune des conditions précédentes n'est remplie et si n et m sont tous deux des nombres octaux (0-7), nm correspondra à la valeur d'échappement octale nm. | |
Si n est un nombre octal (0-7) et m et l sont tous deux des chiffres octaux (0-7), faites correspondre la valeur d'échappement octale nml. | |
correspond à n, où n est un caractère Unicode représenté par quatre chiffres hexadécimaux. Par exemple, u00A9 correspond au symbole de droit d'auteur (©). |