Maison développement back-end tutoriel php Expressions régulières PHP en action : faire correspondre les formats de liseuses

Expressions régulières PHP en action : faire correspondre les formats de liseuses

Jun 22, 2023 pm 06:10 PM
php 正则表达式 电子阅读器

Dans le développement réel, le traitement du format de texte est souvent impliqué, et le format du lecteur de livre électronique est l'un des facteurs à prendre en compte. Dans cet article, nous verrons comment faire correspondre les formats de liseuses électroniques à l'aide d'expressions régulières PHP.

Qu'est-ce que le format de lecteur de livre électronique ?

Le format lecteur de livre électronique est un format de livre électronique qui affiche le contenu du livre électronique à travers des balises spéciales. Les formats courants de lecteurs de livres électroniques incluent EPUB et MOBI.

Le format EPUB est un format de livre électronique largement utilisé qui utilise un balisage basé sur XML pour afficher le contenu des livres électroniques. Le format MOBI est un format de livre électronique lancé par Amazon. Il utilise également des balises spéciales pour afficher le contenu des livres électroniques.

Lors de la correspondance d'expressions régulières, nous devons prendre en compte l'impact de ces balises spéciales sur le texte.

Comment faire correspondre le format du lecteur de livre électronique ?

Ci-dessous, nous présenterons quelques exemples d'utilisation des expressions régulières PHP pour correspondre aux formats de lecteurs de livres électroniques.

  1. Faire correspondre les titres de chapitre au format EPUB

Au format EPUB, les titres de chapitre sont généralement inclus entre les balises <h1> à <h6>. Nous pouvons utiliser l'expression régulière suivante pour faire correspondre les titres de chapitre : <h1><h6>标签中。我们可以使用以下正则表达式来匹配章节标题:

$pattern = "/<h[1-6]>(.+)</h[1-6]>/";
Copier après la connexion

这个正则表达式使用了<h[1-6]></h[1-6]>来匹配章节标题开始和结束的标签。其中[1-6]表示匹配数字1到6,(.+)表示匹配任意字符(除了换行符)。

  1. 匹配MOBI格式中的图像标签

在MOBI格式中,图片一般被包含在<img>标签中。我们可以使用以下正则表达式来匹配图片标签:

$pattern = "/<img.*src="(.+?)".*>/";
Copier après la connexion

这个正则表达式使用了<img.*>来匹配图片标签的开头。其中.*表示匹配0个或多个任意字符。接着使用src="来匹配图片的链接地址,使用(.+?)来匹配图片地址中的任意字符。最后使用.*>来匹配图片标签的结尾。

注意,这里我们使用了?来表示非贪婪模式,这意味着匹配过程会尝试匹配最短的字符串,以避免匹配过多的字符。

  1. 匹配EPUB和MOBI格式中的脚注标签

在EPUB和MOBI格式中,脚注一般被包含在<a>标签中。我们可以使用以下正则表达式来匹配脚注标签:

$pattern = "/<a.*href="#(.+?)".*>(.*?)</a>/";
Copier après la connexion

这个正则表达式使用了来匹配脚注标签的开头。其中.*表示匹配0个或多个任意字符。接着使用href="#来匹配脚注的链接地址,使用(.+?)来匹配链接中的任意字符。接着使用.*>来匹配链接标签的结尾。

最后使用(.*?)rrreee

Cette expression régulière utilise <h[1-6]> et </h[1-6 ]&gt ; pour correspondre aux balises d'ouverture et de fermeture du titre du chapitre. Parmi eux, [1-6] signifie faire correspondre les nombres 1 à 6, et (.+) signifie faire correspondre n'importe quel caractère (sauf le caractère de nouvelle ligne).

    Faire correspondre les balises d'image au format MOBI

    🎜Au format MOBI, les images sont généralement incluses dans la balise <img>. Nous pouvons utiliser l'expression régulière suivante pour faire correspondre les balises d'image : 🎜rrreee🎜Cette expression régulière utilise <img.*> pour faire correspondre le début de la balise d'image. Parmi eux, .* signifie faire correspondre 0 ou plusieurs caractères arbitraires. Utilisez ensuite src=" pour faire correspondre l'adresse du lien de l'image, utilisez (.+?) pour faire correspondre n'importe quel caractère de l'adresse de l'image. Enfin, utilisez . *> pour correspondre à la fin de la balise d'image. 🎜🎜Notez qu'ici nous utilisons ? pour indiquer le mode non gourmand, ce qui signifie que le processus de correspondance tentera de faire correspondre le plus court. chaîne pour éviter les caractères excessifs. 🎜
      🎜Faire correspondre les balises de note de bas de page aux formats EPUB et MOBI🎜🎜🎜Dans les formats EPUB et MOBI, les notes de bas de page sont généralement incluses dans le <a> code> balise . Nous pouvons utiliser l'expression régulière suivante pour faire correspondre les balises de note de bas de page : 🎜rrreee🎜Cette expression régulière utilise pour faire correspondre le début des balises de note de bas de page . correspondant à 0 ou plusieurs caractères arbitraires, puis utilisez href="# pour faire correspondre l'adresse du lien de la note de bas de page, et utilisez (.+?) pour faire correspondre le lien. n'importe quel caractère dans . Utilisez ensuite .*> pour faire correspondre la fin de la balise de lien. 🎜🎜Enfin, utilisez (.*?) pour faire correspondre le contenu de la note de bas de page. Ici, nous utilisons le mode non gourmand pour éviter de faire correspondre trop de caractères. De plus, nous utilisons également des parenthèses pour marquer le contenu des notes de bas de page en vue d'une extraction ultérieure. 🎜🎜Résumé : 🎜🎜Cet article explique comment utiliser les expressions régulières PHP pour faire correspondre les formats de lecteurs de livres électroniques. Grâce aux exemples ci-dessus, vous devriez avoir appris à utiliser des expressions régulières pour faire correspondre du texte dans différents formats. Lorsque vous rencontrez une situation dans laquelle vous devez faire correspondre des formats de texte spéciaux dans le développement réel, vous pouvez vous référer aux expressions régulières mentionnées dans cet article pour résoudre le problème. 🎜

    Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

AI Hentai Generator

Générez AI Hentai gratuitement.

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Meilleurs paramètres graphiques
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Comment réparer l'audio si vous n'entendez personne
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
Où trouver la courte de la grue à atomide atomique
1 Il y a quelques semaines By DDD

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Configuration du projet CakePHP Configuration du projet CakePHP Sep 10, 2024 pm 05:25 PM

Dans ce chapitre, nous comprendrons les variables d'environnement, la configuration générale, la configuration de la base de données et la configuration de la messagerie dans CakePHP.

Guide d'installation et de mise à niveau de PHP 8.4 pour Ubuntu et Debian Guide d'installation et de mise à niveau de PHP 8.4 pour Ubuntu et Debian Dec 24, 2024 pm 04:42 PM

PHP 8.4 apporte plusieurs nouvelles fonctionnalités, améliorations de sécurité et de performances avec une bonne quantité de dépréciations et de suppressions de fonctionnalités. Ce guide explique comment installer PHP 8.4 ou mettre à niveau vers PHP 8.4 sur Ubuntu, Debian ou leurs dérivés. Bien qu'il soit possible de compiler PHP à partir des sources, son installation à partir d'un référentiel APT comme expliqué ci-dessous est souvent plus rapide et plus sécurisée car ces référentiels fourniront les dernières corrections de bogues et mises à jour de sécurité à l'avenir.

Date et heure de CakePHP Date et heure de CakePHP Sep 10, 2024 pm 05:27 PM

Pour travailler avec la date et l'heure dans cakephp4, nous allons utiliser la classe FrozenTime disponible.

CakePHP travaillant avec la base de données CakePHP travaillant avec la base de données Sep 10, 2024 pm 05:25 PM

Travailler avec la base de données dans CakePHP est très simple. Nous comprendrons les opérations CRUD (Créer, Lire, Mettre à jour, Supprimer) dans ce chapitre.

Téléchargement de fichiers CakePHP Téléchargement de fichiers CakePHP Sep 10, 2024 pm 05:27 PM

Pour travailler sur le téléchargement de fichiers, nous allons utiliser l'assistant de formulaire. Voici un exemple de téléchargement de fichiers.

Routage CakePHP Routage CakePHP Sep 10, 2024 pm 05:25 PM

Dans ce chapitre, nous allons apprendre les sujets suivants liés au routage ?

Discuter de CakePHP Discuter de CakePHP Sep 10, 2024 pm 05:28 PM

CakePHP est un framework open source pour PHP. Il vise à faciliter grandement le développement, le déploiement et la maintenance d'applications. CakePHP est basé sur une architecture de type MVC à la fois puissante et facile à appréhender. Modèles, vues et contrôleurs gu

CakePHP créant des validateurs CakePHP créant des validateurs Sep 10, 2024 pm 05:26 PM

Le validateur peut être créé en ajoutant les deux lignes suivantes dans le contrôleur.

See all articles