PHP 修复未正常关闭的HTML标签实现代码(支持嵌套和就近闭合)_PHP
fixHtmlTag
version 0.2
这个版本解决了上次遗留的问题,即就近闭合和嵌套闭合问题。具体可以看代码的注释。
复制代码 代码如下:
/**
* fixHtmlTag
*
* HTML标签修复函数,此函数可以修复未正确闭合的 HTML 标签
*
* 由于不确定性因素太多,暂时提供两种模式“嵌套闭合模式”和
* “就近闭合模式”,应该够用了。
*
* 这两种模式是我为了解释清楚此函数的实现而创造的两个名词,
* 只需明白什么意思就行。
* 1,嵌套闭合模式,NEST,为默认的闭合方式。即 "
* 这样的 html 代码会被修改为 "
* 2,就近闭合模式,CLOSE,这种模式会将形如 "
你好
为什么没有
* 闭合呢" 的代码修改为 "
你好
为什么没有闭合呢
"*
* 在嵌套闭合模式(默认,无需特殊传参)下,可以传入需要就近闭合的
* 标签名,通过这种方式将类似 "
你好
我也好" 转换为
* "
你好
我也好
"的形式。* 传参时索引需要按照如下方式写,不需要修改的设置可以省略
*
* $param = array(
* 'html' => '', //必填
* 'options' => array(
* 'tagArray' => array();
* 'type' => 'NEST',
* 'length' => null,
* 'lowerTag' => TRUE,
* 'XHtmlFix' => TRUE,
* )
* );
* fixHtmlTag($param);
*
* 上面索引对应的值含义如下
* string $html 需要修改的 html 代码
* array $tagArray 当为嵌套模式时,需要就近闭合的标签数组
* string $type 模式名,目前支持 NEST 和 CLOSE 两种模式,如果设置为 CLOSE,将会忽略参数 $tagArray 的设置,而全部就近闭合所有标签
* ini $length 如果希望截断一定长度,可以在此赋值,此长度指的是字符串长度
* bool $lowerTag 是否将代码中的标签全部转换为小写,默认为 TRUE
* bool $XHtmlFix 是否处理不符合 XHTML 规范的标签,即将
转换为
*
* @author IT不倒翁
* @version 0.2
* @link http://yungbo.com IT不倒翁
* @link http://enenba.com/?post=19 某某
* @param array $param 数组参数,需要赋予特定的索引
* @return string $result 经过处理后的 html 代码
* @since 2012-04-14
*/
function fixHtmlTag($param = array()) {
//参数的默认值
$html = '';
$tagArray = array();
$type = 'NEST';
$length = null;
$lowerTag = TRUE;
$XHtmlFix = TRUE;
//首先获取一维数组,即 $html 和 $options (如果提供了参数)
extract($param);
//如果存在 options,提取相关变量
if (isset($options)) {
extract($options);
}
$result = ''; //最终要返回的 html 代码
$tagStack = array(); //标签栈,用 array_push() 和 array_pop() 模拟实现
$contents = array(); //用来存放 html 标签
$len = 0; //字符串的初始长度
//设置闭合标记 $isClosed,默认为 TRUE, 如果需要就近闭合,成功匹配开始标签后其值为 false,成功闭合后为 true
$isClosed = true;
//将要处理的标签全部转为小写
$tagArray = array_map('strtolower', $tagArray);
//“合法”的单闭合标签
$singleTagArray = array(
'''
'
''
//校验匹配模式 $type,默认为 NEST 模式
$type = strtoupper($type);
if (!in_array($type, array('NEST', 'CLOSE'))) {
$type = 'NEST';
}
//以一对 为分隔符,将原 html 标签和标签内的字符串放到数组中
$contents = preg_split("/(]+?>)/si", $html, -1, PREG_SPLIT_NO_EMPTY | PREG_SPLIT_DELIM_CAPTURE);
foreach ($contents as $tag) {
if ('' == trim($tag)) {
$result .= $tag;
continue;
}
//匹配标准的单闭合标签,如
if (preg_match("/]*?\/>/si", $tag)) {
$result .= $tag;
continue;
}
//匹配开始标签,如果是单标签则出栈
else if (preg_match("/]*?>/si", $tag, $match)) {
//如果上一个标签没有闭合,并且上一个标签属于就近闭合类型
//则闭合之,上一个标签出栈
//如果标签未闭合
if (false === $isClosed) {
//就近闭合模式,直接就近闭合所有的标签
if ('CLOSE' == $type) {
$result .= '' . end($tagStack) . '>';
array_pop($tagStack);
}
//默认的嵌套模式,就近闭合参数提供的标签
else {
if (in_array(end($tagStack), $tagArray)) {
$result .= '' . end($tagStack) . '>';
array_pop($tagStack);
}
}
}
//如果参数 $lowerTag 为 TRUE 则将标签名转为小写
$matchLower = $lowerTag == TRUE ? strtolower($match[1]) : $match[1];
$tag = str_replace('//开始新的标签组合
$result .= $tag;
array_push($tagStack, $matchLower);
//如果属于约定的的单标签,则闭合之并出栈
foreach ($singleTagArray as $singleTag) {
if (stripos($tag, $singleTag) !== false) {
if ($XHtmlFix == TRUE) {
$tag = str_replace('>', ' />', $tag);
}
array_pop($tagStack);
}
}
//就近闭合模式,状态变为未闭合
if ('CLOSE' == $type) {
$isClosed = false;
}
//默认的嵌套模式,如果标签位于提供的 $tagArray 里,状态改为未闭合
else {
if (in_array($matchLower, $tagArray)) {
$isClosed = false;
}
}
unset($matchLower);
}
//匹配闭合标签,如果合适则出栈
else if (preg_match("/]*?>/si", $tag, $match)) {
//如果参数 $lowerTag 为 TRUE 则将标签名转为小写
$matchLower = $lowerTag == TRUE ? strtolower($match[1]) : $match[1];
if (end($tagStack) == $matchLower) {
$isClosed = true; //匹配完成,标签闭合
$tag = str_replace('' . $match[1], '' . $matchLower, $tag);
$result .= $tag;
array_pop($tagStack);
}
unset($matchLower);
}
//匹配注释,直接连接 $result
else if (preg_match("//si", $tag)) {
$result .= $tag;
}
//将字符串放入 $result ,顺便做下截断操作
else {
if (is_null($length) || $len + mb_strlen($tag) $result .= $tag;
$len += mb_strlen($tag);
} else {
$str = mb_substr($tag, 0, $length - $len + 1);
$result .= $str;
break;
}
}
}
//如果还有将栈内的未闭合的标签连接到 $result
while (!empty($tagStack)) {
$result .= '' . array_pop($tagStack) . '>';
}
return $result;
}

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











HTML(HyperTextMarkupLanguage)은 웹 페이지를 생성하기 위한 표준 언어로, 텍스트, 이미지, 표, 링크 등과 같은 페이지의 다양한 요소를 설명하기 위해 태그와 속성을 사용합니다. 그러나 HTML 텍스트를 처리할 때 후속 처리를 위해 텍스트 내용을 빠르게 추출하는 것은 어렵습니다. 이때 Python에서 정규식을 사용하여 HTML 태그를 제거하면 일반 텍스트를 빠르게 추출할 수 있습니다. Python에서는 일반 테이블

정규식을 사용하여 Go 언어에서 HTML 태그 콘텐츠를 추출하는 방법 소개: 정규식은 강력한 텍스트 일치 도구이며 Go 언어에서도 널리 사용됩니다. HTML 태그를 처리하는 시나리오에서 정규식은 필요한 콘텐츠를 빠르게 추출하는 데 도움이 될 수 있습니다. 이 기사에서는 정규식을 사용하여 Go 언어에서 HTML 태그의 내용을 추출하는 방법을 소개하고 관련 코드 예제를 제공합니다. 1. 관련 패키지 소개 먼저 관련 패키지인 regexp 및 fmt를 가져와야 합니다. 정규식 패키지는 다음을 제공합니다

PHP는 웹 사이트 개발 및 백엔드 애플리케이션 개발에 널리 사용되는 일반적으로 사용되는 서버 측 스크립팅 언어입니다. 웹사이트나 애플리케이션을 개발할 때 HTML 태그를 문자열로 처리해야 하는 상황에 자주 직면하게 됩니다. 이 기사에서는 PHP를 사용하여 문자열에서 HTML 태그를 제거하는 방법을 소개하고 구체적인 코드 예제를 제공합니다. HTML 태그를 제거해야 하는 이유는 무엇입니까? 사용자 입력이나 데이터베이스에서 얻은 텍스트를 처리할 때 HTML 태그가 포함되는 경우가 많습니다. 때로는 텍스트를 표시할 때 이러한 HTML 태그를 제거하고 싶을 때가 있습니다.

PHP에서는 htmlentities() 함수를 사용하여 html을 이스케이프할 수 있으며, 이는 문자를 HTML 엔터티로 변환할 수 있습니다. 구문은 "htmlentities(string,flags,character-set,double_encode)"입니다. 또한 PHP에서 html_entity_decode() 함수를 사용하여 html을 이스케이프 해제하고 HTML 엔터티를 문자로 변환할 수 있습니다.

String은 Java의 최종 클래스이며 불변입니다. 즉, 객체 자체는 변경할 수 없지만 객체의 참조는 변경할 수 있습니다. HTML 태그는 String 클래스의 replacementAll() 메서드를 사용하여 지정된 문자열에서 제거할 수 있습니다. 정규식을 사용하여 특정 문자열에서 HTML 태그를 제거할 수 있습니다. 문자열에서 HTML 태그를 제거한 후 문자열을 일반 텍스트로 반환합니다. 구문 publicStringreplaceAll(Stringregex,Stringreplacement) 예 publicclassRemoveHTMLTagsTest{&nbs

테이블에 HTML 태그를 쉽게 추가할 수 있습니다. HTML 태그는 <td> 태그 안에 배치되어야 합니다. 예를 들어 <td> 태그 내에 단락 <p>…</p> 태그나 사용 가능한 기타 태그를 추가합니다. 구문 다음은 HTML 테이블에서 HTML 태그를 사용하기 위한 구문입니다. <td><p>컨텍스트 단락</p><td>예제 1 HTML 테이블에서 HTML 태그를 사용하는 예는 다음과 같습니다. <!DOCTYPEhtml><html><head&g

PHP는 정규식 기능을 지원하고 입력 데이터의 유효성을 빠르게 확인할 수 있는 효율적인 웹 개발 언어입니다. 웹 개발에서 HTML은 일반적인 마크업 언어이며 HTML 태그의 유효성을 검사하는 것은 웹 양식 유효성 검사를 위한 매우 중요한 방법입니다. 이 기사에서는 기본적인 HTML 태그 확인 방법과 확인을 위해 PHP 정규식을 사용하는 방법을 소개합니다. 1. HTML 태그의 기본 구조 HTML 태그는 꺾쇠괄호로 묶인 요소 이름과 속성으로 구성됩니다. 일반적인 태그에는 p, a, div가 있습니다.

HTML에는<!DOCTYPE>、<html>、<head>、<title>、<meta>、<link>、<style>、<script>、<body>、<h1> - <h6>、<p >、<a>、<img>、<div>、<span>、<입력>、<버튼>、<양식
