Maison développement back-end tutoriel php PHP 修复未正常关闭的HTML标签实现代码(支持嵌套和就近闭合)_PHP

PHP 修复未正常关闭的HTML标签实现代码(支持嵌套和就近闭合)_PHP

Jun 01, 2016 pm 12:11 PM
html标签

fixHtmlTag
version 0.2
这个版本解决了上次遗留的问题,即就近闭合和嵌套闭合问题。具体可以看代码的注释。
复制代码 代码如下:

/**
* fixHtmlTag
*
* HTML标签修复函数,此函数可以修复未正确闭合的 HTML 标签
*
* 由于不确定性因素太多,暂时提供两种模式“嵌套闭合模式”和
* “就近闭合模式”,应该够用了。
*
* 这两种模式是我为了解释清楚此函数的实现而创造的两个名词,
* 只需明白什么意思就行。
* 1,嵌套闭合模式,NEST,为默认的闭合方式。即 "

你好"
* 这样的 html 代码会被修改为 "
你好
"
* 2,就近闭合模式,CLOSE,这种模式会将形如 "

你好

为什么没有
* 闭合呢" 的代码修改为 "

你好

为什么没有闭合呢

"
*
* 在嵌套闭合模式(默认,无需特殊传参)下,可以传入需要就近闭合的
* 标签名,通过这种方式将类似 "

你好

我也好" 转换为
* "

你好

我也好

"的形式。
* 传参时索引需要按照如下方式写,不需要修改的设置可以省略
*
* $param = array(
* 'html' => '', //必填
* 'options' => array(
* 'tagArray' => array();
* 'type' => 'NEST',
* 'length' => null,
* 'lowerTag' => TRUE,
* 'XHtmlFix' => TRUE,
* )
* );
* fixHtmlTag($param);
*
* 上面索引对应的值含义如下
* string $html 需要修改的 html 代码
* array $tagArray 当为嵌套模式时,需要就近闭合的标签数组
* string $type 模式名,目前支持 NEST 和 CLOSE 两种模式,如果设置为 CLOSE,将会忽略参数 $tagArray 的设置,而全部就近闭合所有标签
* ini $length 如果希望截断一定长度,可以在此赋值,此长度指的是字符串长度
* bool $lowerTag 是否将代码中的标签全部转换为小写,默认为 TRUE
* bool $XHtmlFix 是否处理不符合 XHTML 规范的标签,即将
转换为

*
* @author IT不倒翁
* @version 0.2
* @link http://yungbo.com IT不倒翁
* @link http://enenba.com/?post=19 某某
* @param array $param 数组参数,需要赋予特定的索引
* @return string $result 经过处理后的 html 代码
* @since 2012-04-14
*/
function fixHtmlTag($param = array()) {
//参数的默认值
$html = '';
$tagArray = array();
$type = 'NEST';
$length = null;
$lowerTag = TRUE;
$XHtmlFix = TRUE;

//首先获取一维数组,即 $html 和 $options (如果提供了参数)
extract($param);

//如果存在 options,提取相关变量
if (isset($options)) {
extract($options);
}

$result = ''; //最终要返回的 html 代码
$tagStack = array(); //标签栈,用 array_push() 和 array_pop() 模拟实现
$contents = array(); //用来存放 html 标签
$len = 0; //字符串的初始长度

//设置闭合标记 $isClosed,默认为 TRUE, 如果需要就近闭合,成功匹配开始标签后其值为 false,成功闭合后为 true
$isClosed = true;

//将要处理的标签全部转为小写
$tagArray = array_map('strtolower', $tagArray);

//“合法”的单闭合标签
$singleTagArray = array(
''''
'
''PHP 修复未正常关闭的HTML标签实现代码(支持嵌套和就近闭合)_PHP);

//校验匹配模式 $type,默认为 NEST 模式
$type = strtoupper($type);
if (!in_array($type, array('NEST', 'CLOSE'))) {
$type = 'NEST';
}

//以一对 为分隔符,将原 html 标签和标签内的字符串放到数组中
$contents = preg_split("/(]+?>)/si", $html, -1, PREG_SPLIT_NO_EMPTY | PREG_SPLIT_DELIM_CAPTURE);

foreach ($contents as $tag) {
if ('' == trim($tag)) {
$result .= $tag;
continue;
}

//匹配标准的单闭合标签,如

if (preg_match("/]*?\/>/si", $tag)) {
$result .= $tag;
continue;
}

//匹配开始标签,如果是单标签则出栈
else if (preg_match("/]*?>/si", $tag, $match)) {
//如果上一个标签没有闭合,并且上一个标签属于就近闭合类型
//则闭合之,上一个标签出栈

//如果标签未闭合
if (false === $isClosed) {
//就近闭合模式,直接就近闭合所有的标签
if ('CLOSE' == $type) {
$result .= '' . end($tagStack) . '>';
array_pop($tagStack);
}
//默认的嵌套模式,就近闭合参数提供的标签
else {
if (in_array(end($tagStack), $tagArray)) {
$result .= '' . end($tagStack) . '>';
array_pop($tagStack);
}
}
}

//如果参数 $lowerTag 为 TRUE 则将标签名转为小写
$matchLower = $lowerTag == TRUE ? strtolower($match[1]) : $match[1];

$tag = str_replace('//开始新的标签组合
$result .= $tag;
array_push($tagStack, $matchLower);

//如果属于约定的的单标签,则闭合之并出栈
foreach ($singleTagArray as $singleTag) {
if (stripos($tag, $singleTag) !== false) {
if ($XHtmlFix == TRUE) {
$tag = str_replace('>', ' />', $tag);
}
array_pop($tagStack);
}
}

//就近闭合模式,状态变为未闭合
if ('CLOSE' == $type) {
$isClosed = false;
}
//默认的嵌套模式,如果标签位于提供的 $tagArray 里,状态改为未闭合
else {
if (in_array($matchLower, $tagArray)) {
$isClosed = false;
}
}
unset($matchLower);
}

//匹配闭合标签,如果合适则出栈
else if (preg_match("/]*?>/si", $tag, $match)) {

//如果参数 $lowerTag 为 TRUE 则将标签名转为小写
$matchLower = $lowerTag == TRUE ? strtolower($match[1]) : $match[1];

if (end($tagStack) == $matchLower) {
$isClosed = true; //匹配完成,标签闭合
$tag = str_replace('' . $match[1], '' . $matchLower, $tag);
$result .= $tag;
array_pop($tagStack);
}
unset($matchLower);
}

//匹配注释,直接连接 $result
else if (preg_match("//si", $tag)) {
$result .= $tag;
}

//将字符串放入 $result ,顺便做下截断操作
else {
if (is_null($length) || $len + mb_strlen($tag) $result .= $tag;
$len += mb_strlen($tag);
} else {
$str = mb_substr($tag, 0, $length - $len + 1);
$result .= $str;
break;
}
}
}

//如果还有将栈内的未闭合的标签连接到 $result
while (!empty($tagStack)) {
$result .= '' . array_pop($tagStack) . '>';
}
return $result;
}
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

AI Hentai Generator

Générez AI Hentai gratuitement.

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Meilleurs paramètres graphiques
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Comment réparer l'audio si vous n'entendez personne
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
Où trouver la courte de la grue à atomide atomique
1 Il y a quelques semaines By DDD

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Comment extraire le contenu des balises HTML à l'aide d'expressions régulières en langage Go Comment extraire le contenu des balises HTML à l'aide d'expressions régulières en langage Go Jul 14, 2023 pm 01:18 PM

Comment utiliser des expressions régulières pour extraire le contenu des balises HTML dans le langage Go Introduction : L'expression régulière est un puissant outil de correspondance de texte, et elle est également largement utilisée dans le langage Go. Dans le scénario de traitement des balises HTML, les expressions régulières peuvent nous aider à extraire rapidement le contenu requis. Cet article expliquera comment utiliser des expressions régulières pour extraire le contenu des balises HTML en langage Go et donnera des exemples de code pertinents. 1. Introduire les packages associés Tout d'abord, nous devons importer les packages associés : regexp et fmt. Le package regexp fournit

Comment supprimer les balises HTML à l'aide des expressions régulières Python Comment supprimer les balises HTML à l'aide des expressions régulières Python Jun 22, 2023 am 08:44 AM

HTML (HyperTextMarkupLanguage) est un langage standard pour créer des pages Web. Il utilise des balises et des attributs pour décrire divers éléments de la page, tels que du texte, des images, des tableaux, des liens, etc. Cependant, lors du traitement de texte HTML, il est difficile d'extraire rapidement le contenu du texte pour un traitement ultérieur. À l'heure actuelle, nous pouvons utiliser des expressions régulières en Python pour supprimer les balises HTML afin d'extraire rapidement le texte brut. En Python, les tables régulières

Comment supprimer les balises HTML d'une chaîne en PHP ? Comment supprimer les balises HTML d'une chaîne en PHP ? Mar 23, 2024 pm 09:03 PM

PHP est un langage de script côté serveur couramment utilisé dans le développement de sites Web et le développement d'applications back-end. Lors du développement d'un site Web ou d'une application, vous rencontrez souvent des situations dans lesquelles vous devez traiter des balises HTML dans des chaînes. Cet article explique comment utiliser PHP pour supprimer les balises HTML des chaînes et fournit des exemples de code spécifiques. Pourquoi devez-vous supprimer les balises HTML ? Les balises HTML sont souvent incluses lors du traitement des entrées utilisateur ou du texte obtenu à partir d'une base de données. Parfois, nous souhaitons supprimer ces balises HTML lors de l'affichage du texte

Comment échapper aux balises HTML en php Comment échapper aux balises HTML en php Feb 24, 2021 pm 06:00 PM

En PHP, vous pouvez utiliser la fonction htmlentities() pour échapper au HTML, qui peut convertir des caractères en entités HTML. La syntaxe est "htmlentities(string,flags,character-set,double_encode)". Vous pouvez également utiliser la fonction html_entity_decode() en PHP pour déséchapper le HTML et convertir les entités HTML en caractères.

Comment supprimer les balises HTML d'une chaîne donnée en Java ? Comment supprimer les balises HTML d'une chaîne donnée en Java ? Aug 29, 2023 pm 06:05 PM

String est une classe finale en Java, elle est immuable, ce qui signifie que nous ne pouvons pas changer l'objet lui-même, mais nous pouvons changer la référence de l'objet. Les balises HTML peuvent être supprimées d'une chaîne donnée à l'aide de la méthode replaceAll() de la classe String. Nous pouvons supprimer les balises HTML d'une chaîne donnée à l'aide d'expressions régulières. Après avoir supprimé les balises HTML de la chaîne, il renvoie une chaîne sous forme de texte normal. Exemple de syntaxe publicStringreplaceAll(Stringregex,Stringreplacement) publicclassRemoveHTMLTagsTest{&nbs

Comment utiliser les balises HTML dans les tableaux HTML ? Comment utiliser les balises HTML dans les tableaux HTML ? Sep 08, 2023 pm 06:13 PM

Nous pouvons facilement ajouter des balises HTML dans le tableau. Les balises HTML doivent être placées à l'intérieur des balises <td>. Par exemple, ajoutez des balises de paragraphe <p>…</p> ou d'autres balises disponibles à l'intérieur de la balise <td>. Syntaxe Voici la syntaxe d'utilisation des balises HTML dans les tableaux HTML. <td><p>Paragrapheducontexte</p><td>Exemple 1 Un exemple d'utilisation de balises HTML dans un tableau HTML est donné ci-dessous. <!DOCTYPEhtml><html><head&g

Méthode d'expression régulière PHP pour vérifier les balises HTML de base Méthode d'expression régulière PHP pour vérifier les balises HTML de base Jun 24, 2023 am 08:07 AM

PHP est un langage de développement Web efficace qui prend en charge les fonctions d'expression régulière et peut vérifier rapidement la validité des données d'entrée. Dans le développement Web, HTML est un langage de balisage courant et la validation des balises HTML est une méthode très importante pour la validation des formulaires Web. Cet article présentera les méthodes de base de vérification des balises HTML et comment utiliser les expressions régulières PHP pour la vérification. 1. Structure de base des balises HTML Les balises HTML sont constituées de noms d'éléments et d'attributs entourés de crochets angulaires. Les balises courantes incluent p, a, div.

Collection complète de balises HTML Collection complète de balises HTML Nov 27, 2023 am 10:05 AM

HTML标签有<!DOCTYPE>、<html>、<head>、<title>、<meta>、<link>、<style>、<script>、<body>、<h1> - <h6>、<p >、<a>、<img>、<div>、<span>、<input>、<bouton>、<formulaire

See all articles