Le principe de base consiste à utiliser une série de caractères spéciaux et une syntaxe pour faire correspondre et manipuler les données textuelles. Une expression régulière se compose généralement d'une chaîne de modèle qui décrit un modèle de texte à mettre en correspondance, ainsi que d'un ou plusieurs caractères spéciaux et d'une syntaxe qui contrôlent comment et quel est le résultat. Les expressions régulières en Python sont généralement implémentées à l'aide du module re-Tutoriel Python-php.cn

Qu'est-ce qu'une expression régulière ?

Expression régulière, également connue sous le nom d'expression régulière, (anglais : Regular Expression, souvent abrégée en regex, regexp ou RE dans le code), c'est un concept en informatique. Les expressions régulières sont souvent utilisées pour récupérer et remplacer du texte qui correspond à un certain modèle. De nombreux langages de programmation prennent en charge la manipulation de chaînes à l'aide d'expressions régulières. Par exemple, Perl intègre un puissant moteur d’expressions régulières. Le concept d’expressions régulières a été popularisé à l’origine par des logiciels-outils sous Unix. Une expression régulière est une formule logique qui opère sur des chaînes (y compris des caractères ordinaires (par exemple, les lettres entre a à z) et des caractères spéciaux (appelés « métacaractères »)), qui utilise certains caractères spécifiques prédéfinis, et la combinaison de ces caractères spécifiques. les caractères forment une "chaîne de règle". Cette "chaîne de règle" est utilisée pour exprimer une logique de filtrage des chaînes. Une expression régulière est un modèle de texte qui décrit une ou plusieurs chaînes à rechercher lors de la recherche de texte.

1. Présentation des exemples

J'ai dit beaucoup de bêtises, et tout le monde peut encore être confus. Illustrons cela à travers des exemples. Nous pouvons utiliser des outils de test d'expressions régulières ou Python. Tout d'abord, nous saisissons un texte de paragraphe.

bonjour, je m'appelle Tina, mon numéro de téléphone est le 123456 et mon site Web est http://tina.com.

                               [a-zA-z]+://[^\s]*

Copier après la connexion

Nous pouvons obtenir le lien Web, qui est l'url dans le texte, n'est-ce pas incroyable?

C'est parce qu'il a ses propres règles de correspondance, dont certaines sont les suivantes.

Motif	Description
.	Tout personnage
*	0 expressions ou plus
+	Une ou plusieurs expressions

Vous pouvez vérifier plus de correspondance règles par vous-même.

?,*,+,d,w sont tous des caractères équivalents
équivaut à la longueur correspondante {0,1}
* équivaut à la longueur correspondante {0,}

+ équivaut à la longueur correspondante {1,}
d équivaut à [0-9]
D équivaut à [^0-9]
w équivaut à [A - Za-Z_0-9]
W est équivalent à [^a-Za-Z_0-9]

2.match ()

Ici, j'introduis une méthode de correspondance couramment utilisée & mdash & mdash; () , en lui passant la chaîne à rechercher et l'expression régulière, vous pouvez vérifier si l'expression régulière correspond à la chaîne.

Matching target

res = re.match(&#39;hello\s(\d+)sword&#39;)

Copier après la connexion

Greedy matching

res = re.match(&#39;hello.*(\d+)sword&#39;)

Copier après la connexion

3.findall()

C'est ce que nous utilisons le plus, voyons comment cela est utilisé.

import re
 
useData = str(input(&#39;请输入字符串数据:&#39;))
 
&#39;&#39;&#39;
匹配字符串中的数字,+是匹配前面的子表达式一次或多次
&#39;&#39;&#39;
digital = re.findall(&#39;\d+&#39;,useData)
 
print(digital)

Copier après la connexion

Jetons un coup d'œil aux résultats en cours d'exécution

La fonction findall() renvoie toutes les chaînes correspondantes et le type de données de la valeur de retour est une liste.

Symboles communs

Parlons des symboles communs des expressions régulières.

Le caractère "." correspond à n'importe quel caractère.
Le caractère "" est un caractère d'échappement.
"[…]" est le jeu de caractères.
"(.*?)" est le caractère le plus couramment utilisé dans les robots d'exploration Python. Il s'appelle un algorithme glouton et peut correspondre à n'importe quel caractère.

Regardons un exemple de code ci-dessous.

import re
 
a=‘xxixxjshdxxlovexxsfhxxpythonxx&#39;
 
data=re.findall(‘xx(.*?)xx&#39;)
 
print(data)

Copier après la connexion

Exécutons-le et voyons l'effet. "Résultats d'exécution" Cela signifie que cela signifie n'importe quelle chaîne. Si vous souhaitez trouver le symbole * dans une chaîne, vous devez échapper au *, c'est-à-dire ajouter un avant, runo*ob correspond à la chaîne runo*ob.

De nombreux métacaractères nécessitent un traitement spécial lorsqu'on essaie de les faire correspondre. Pour faire correspondre ces caractères spéciaux, vous devez d'abord "échapper" aux caractères, c'est-à-dire les faire précéder d'une barre oblique inverse. Le tableau suivant répertorie les caractères spéciaux dans les expressions régulières :

Caractère spécial

Description

$() marque le début et la fin d'une sous-expression. Les sous-expressions peuvent être obtenues pour une utilisation ultérieure. Pour faire correspondre ces caractères, utilisez ( et ). * Correspond à la sous-expression précédente zéro ou plusieurs fois. Pour faire correspondre le caractère *, utilisez *. + correspond à la sous-expression précédente une ou plusieurs fois. Pour faire correspondre le caractère +, utilisez +. . correspond à n'importe quel caractère à l'exception du caractère de nouvelle ligne n. Pour faire correspondre , utilisez .

概念说了一大堆，大家可能也记不住，我直接说几个案例，大家就能明白其他的道理。

这是某网的HTML，部分片段如下：

<span class=“price”>§<i>123</i></span>
 
<span class=“price”>§<i>133</i></span>
 
<span class=“price”>§<i>156</i></span>
 
<span class=“price”>§<i>189</i></span>

Copier après la connexion

大家会发现只有中间的一段不一样，而不一样的数据就是我们想要的，我们怎么用正则表达式提取出来呢.

<span class=“price”>§<i>(.*?)</i></span>

Copier après la connexion

就可以了，我们看看效果吧。

123
133
156
189

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Étiquettes associées：

python

Article précédent：Comment implémenter le multitâche et le multithreading en utilisant Python ? Article suivant：Comment implémenter des problèmes de permutation et de combinaison à l'aide des fonctions intégrées de Python et de l'algorithme DFS auto-écrit

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Derniers articles par auteur

Comment fonctionnent les LLM: pré-formation à la formation post-formation, réseaux de neurones, hallucinations et inférence

2025-02-26 03:58:14
J'ai combiné la blockchain et l'IA pour générer de l'art. Voici ce qui s'est passé ensuite.

2025-02-26 03:38:10
Ingénierie rapide avancée: chaîne de pensée (COT)

2025-02-26 03:17:10
Génération augmentée augmentée de récupération dans SQLite

2025-02-26 02:49:09
Comment utiliser un chauffeur à propulsion LLM pour construire votre propre API Node.js

2025-02-26 01:08:13
LLMS pour le codage en 2024: prix, performance et bataille pour le meilleur

2025-02-26 00:46:10
Invitant les modèles de langue de vision

2025-02-25 23:42:08
Comment mesurer la fiabilité de la réponse d'un modèle grand

2025-02-25 22:50:13
Une illusion de la vie

2025-02-25 21:54:11
Les scientifiques vont sérieux au sujet de grands modèles de langue reflétant la pensée humaine

2025-02-25 20:45:11

Derniers numéros

python3.x - Java appelle python, le code python s'arrête automatiquement et la raison est introuvable

Depuis 1970-01-01 08:00:00

python - Existe-t-il des forums ou des livres pertinents sur le développement Web Python?

Depuis 1970-01-01 08:00:00

python - Rapport d'erreurs Ubuntu16.04 LXML

Depuis 1970-01-01 08:00:00

"Impossible d'installer mysql-python, erreur : mysql_config introuvable"

Depuis 1970-01-01 08:00:00

Comment intégrer du code Python dans HTML ?

Depuis 1970-01-01 08:00:00

Rubriques connexes

Plus>

Recommandations populaires

Tutoriels populaires

Plus>

Tutoriels associés

Recommandations populaires

Derniers cours

Derniers téléchargements

Plus>

effets Web

Code source du site Web

Matériel du site Web

Modèle frontal

Correspond à la position de fin de la chaîne d'entrée. Si la propriété Multiline de l'objet RegExp est définie, $ correspond également à «n’ ou «r’. Pour faire correspondre le caractère $ lui-même, utilisez $.