Résumé des expressions régulières PHP et des annotations grammaticales couramment utilisées

WJ
Libérer: 2023-04-08 17:54:01
avant
2974 Les gens l'ont consulté

Syntaxe de base

Délimiteur :

identifie le début et la fin d'une expression régulière, utilisez '/' ou ' #' ou '{ }', car la syntaxe '{ }' peut également être un opérateur d'expression régulière, pour éviter toute confusion, il n'est pas recommandé de l'utiliser. L'utilisation recommandée est la suivante :

Copy$pattern = '/[0-9]/';  //我喜欢这个,看起来比较简洁 $pattern = '#[0-9]#';
Copier après la connexion

Atomes :

Atomes visibles : caractères de la table d'encodage Unicode visibles à l'œil nu après une sortie au clavier, par exemple : Ponctuation ; / Ou des caractères visibles tels que des lettres anglaises, des caractères chinois, etc.
Atomes invisibles : caractères de la table de codage Unicode qui sont invisibles à l'œil nu après une sortie au clavier, tels que : nouvelle ligne n, Tab t, espace, etc. ,
Généralement, seuls ces trois caractères sont utilisés (les caractères de nouvelle ligne sont généralement mis en correspondance avec d'autres caractères, car seuls les caractères de nouvelle ligne ne peuvent pas correspondre)
Conseils : vous devez ajouter ' ' avant l'opérateur de correspondance. Par exemple : signe '+', en cas de correspondance, vous devez écrire '+'

métacaractères

Méthode de filtrage atomique :

| Faire correspondre deux ou plusieurs sélections de branches
[] correspond à n'importe quel atome entre crochets
[^] correspond à n'importe quel caractère à l'exception des atomes entre crochets
Exemple : Duang| duang ou [Dd]uang Les deux peuvent correspondre à Duang et duang
écriture à intervalles : [a-z] correspond aux caractères de a à z, [0-9] correspond aux caractères de 0 à 9. Il peut également s'agir de [a-z0-9]
Correspond à n'importe quel caractère, à l'exception du caractère de nouvelle ligne
d correspond à n'importe quel chiffre décimal, c'est-à-dire que {0-9]
D correspond à n'importe quel chiffre non décimal [^. 0-9] équivaut à [^d]
s correspondant à un atome invisible, c'est-à-dire [fnrtv]
S correspond à un atome visible, c'est-à-dire [fnrtv], équivalent à [s]z
w Correspond à n'importe quel chiffre, lettre ou trait de soulignement, c'est-à-dire [0-9a-zA-Z_]
W correspond à n'importe quel autre chiffre, lettre ou trait de soulignement, [0-9a-zA-Z_], ce qui équivaut à [w]

Quantificateur

{n} signifie que l'atome devant lui apparaît exactement n fois.
[n] signifie que l'atome précédent apparaît au moins n fois
{n,m} apparaît au moins n fois et au plus m fois
* correspond à 0 fois, une ou plusieurs fois, c'est-à-dire, {0,}
+ correspond à une ou plusieurs fois, c'est-à-dire {1,}
 ? Correspond à 0 ou 1 fois, c'est-à-dire {0,1}

Contrôle des frontières

^ correspond à la position de départ de la chaîne
$ correspond à la position de fin de la chaîne
Exemple : ^John peut correspondre à : John mais ne peut pas correspondre à : 123John, car la chaîne est spécifié pour commencer par John Commençant par

unité de modèle

() correspond à la partie entière en tant qu'atome, tel que : (X|x)iaomi , qui peut correspondre à xiaomi

Mode de correction

Correspondance gourmande

Lorsque le résultat de la correspondance est ambigu, prenez le plus long (par défaut)

Correspondance paresseuse

Lorsque le résultat de la correspondance est ambigu, choisissez le plus court, ajoutez simplement 'U' après '/' dans l'expression régulière, pour exemple '/[0-9]/U';
Exemple :

Copy$subject = "test__123123123";
preg_match('/test.+123/', $subject, $matches); //贪婪模式  var_dump($matches);
preg_match('/test.+123/U', $subject, $matches); //懒惰模式var_dump($matches);
Copier après la connexion

Modèles de correction courants :

U Correspondance paresseuse
i Ignorer la casse des lettres anglaises
x Ignorer les caractères d'espacement dans les expressions régulières
s Laisser le métacaractère '.' correspondre à tous les caractères, y compris les nouvelles lignes

Fonctions communes

preg_match

sont exécutés Match Regular Expression

preg_match ( string $pattern , string $subject [, array &$matches [, int $flags = 0 [, int $offset = 0 ]]] ) : int
Copier après la connexion

pattern : modèle à rechercher, type de chaîne. sujet : chaîne d'entrée. match : si le paramètre matches est fourni, il sera rempli avec les résultats de la recherche et la structure des données est un tableau unidimensionnel. flags : peut être défini sur PREG_OFFSET_CAPTURE, en utilisant le 0ème élément du résultat de la recherche comme chaîne correspondante et le 1er élément comme décalage (position) correspondant. offset : La recherche commence à partir de la position de départ de la chaîne cible.

Valeur de retour : nombre de correspondances
Similaire à la fonction preg_match_all, les paramètres sont cohérents avec preg_match
Différence :

preg_match : ne correspond qu'une seule fois, le résultat des données de la recherche la structure de correspondance est un tableau unidimensionnel preg_match_all : Correspond à tout, la structure de données de la correspondance des résultats de recherche est un tableau à deux dimensions.

preg_replace

Effectue une recherche et un remplacement d'expression régulière, et la valeur de retour est la chaîne remplacée

preg_replace ( mixed $pattern , mixed $replacement , mixed $subject [, int $limit = -1 [, int &$count ]] ) : mixed
Copier après la connexion

pattern : le modèle à rechercher. Peut être une chaîne ou un tableau de chaînes. remplacement : une chaîne ou un tableau de chaînes utilisé pour le remplacement. sujet : une chaîne ou un tableau de chaînes à rechercher et à remplacer. limite : le nombre maximum de remplacements. La valeur par défaut est -1 (illimité). count : nombre de remplacements.
Similaire à la fonction preg_filter, les paramètres sont les mêmes que preg_replace
Différences (la différence ne peut être vue qu'en utilisant des tableaux pour la correspondance) : preg_replace : renvoie tous les résultats, qu'il y ait remplacement ou non. preg_filter : uniquement renvoie des résultats correspondants.

preg_split

Séparer les chaînes par une expression régulière

preg_split ( string $pattern , string $subject [, int $limit = -1 [, int $flags = 0 ]] ) : array
Copier après la connexion

$pattrn:用于搜索的模式,字符串形式。subject:输入字符串limit:将限制分隔得到的子串最多只有limit个,返回的最后一个 子串将包含所有剩余部分。flags:有以下标记的组合:
-- 1. PREG_SPLIT_NO_EMPTY: 返回分隔后的非空部分。
-- 2. PREG_SPLIT_DELIM_CAPTURE: 用分隔符'()'括号把匹配的捕获并返回。
-- 3. PREG_SPLIT_OFFSET_CAPTURE: 匹配返回时将会附加字符串偏移量

PREG_SPLIT_DELIM_CAPTURE这个参数可能比较难明白,举个例子看看:

Copy$subject = "1a23b";  
$a = preg_split('/[\d]/', $subject, -1, PREG_SPLIT_NO_EMPTY);  
var_dump($a);  
$a = preg_split('/([\d])/', $subject, -1, PREG_SPLIT_NO_EMPTY | PREG_SPLIT_DELIM_CAPTURE); 
var_dump($a);
Copier après la connexion

输出如下:

array (size=2)
0 => string 'a' (length=1)
1 => string 'b' (length=1)
array (size=5)
0 => string '1' (length=1)
1 => string 'a' (length=1)
2 => string '2' (length=1)
3 => string '3' (length=1)
4 => string 'b' (length=1)

preg_grep

返回匹配模式的数组条目

preg_grep ( string $pattern , array $input [, int $flags = 0 ] ) : array
Copier après la connexion

$pattern:要搜索的模式,字符串形式$input:输入数组flags:如果不设置则返回匹配的数目,设置PREG_GREP_INVERT则返回不匹配的数目。

preg_quote

转义正则表达式字符,返回为转义后的字符串

preg_quote ( string $str [, string $delimiter = NULL ] ) : string

str:输入字符串delimiter:需要转义的字符串

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Étiquettes associées:
source:csdn.net
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal
À propos de nous Clause de non-responsabilité Sitemap
Site Web PHP chinois:Formation PHP en ligne sur le bien-être public,Aidez les apprenants PHP à grandir rapidement!