> 백엔드 개발 > PHP 문제 > PHP에서 HTML 태그를 제거하는 방법(3가지 방법)

PHP에서 HTML 태그를 제거하는 방법(3가지 방법)

PHPz
풀어 주다: 2023-04-10 11:11:09
원래의
5130명이 탐색했습니다.

인터넷 기술의 지속적인 발전으로 웹사이트 개발은 점점 더 복잡해지고 풍부해졌습니다. 웹사이트 유지관리 및 개발에는 HTML 코드가 자주 사용됩니다. HTML은 웹페이지의 기본이지만 때로는 HTML에서 일반 텍스트를 추출해야 하므로 HTML 태그를 제거해야 합니다. 이러한 요구에 부응하여 이 기사에서는 PHP를 사용하여 HTML을 제거하는 방법을 소개합니다.

1. HTML을 제거하려면 Strip_tags 함수를 사용하세요

PHP에서는 HTML 태그를 제거하는 데 특별히 Strip_tags 함수가 사용됩니다. 이 함수의 사용법은 다음과 같습니다.

strip_tags($str, $allowTags)
로그인 후 복사

그 중 $str은 처리할 문자열이고, $allowTags는 선택적 매개변수로, 지정하지 않을 경우 모든 HTML을 보관할 수 있는 HTML 태그를 나타냅니다. 태그가 제거됩니다. 다음은 샘플 코드입니다.

$html = '<p>这是一段带有HTML标签的文本,<a href="https://www.example.com">这是链接</a>。</p>';
echo strip_tags($html);
로그인 후 복사

출력은 다음과 같습니다.

这是一段带有HTML标签的文本,这是链接。
로그인 후 복사
로그인 후 복사
로그인 후 복사

이 코드는 HTML 태그를 제거하고 텍스트만 유지합니다.

2. 정규식을 사용하여 HTML을 제거하세요

strip_tags 함수를 사용하는 것 외에도 정규식을 사용하여 HTML 태그를 제거할 수도 있습니다. 정규식을 사용하기 전에 HTML 태그의 기본 구문을 이해해야 합니다.

HTML 태그는 꺾쇠 괄호로 둘러싸여 있으며 시작 태그와 종료 태그가 있습니다. 여는 태그는 "<"로 시작하고 ">"로 끝나며, 닫는 태그는 ""로 끝납니다. 태그 이름은 문자, 숫자, 밑줄로 구성됩니다.

다음은 HTML 태그를 제거하는 데 사용할 수 있는 간단한 정규식 예제 코드입니다.

$html = '<p>这是一段带有HTML标签的文本,<a href="https://www.example.com">这是链接</a>。</p>';
echo preg_replace('/<[^>]+>/u', '', $html);
로그인 후 복사

출력 결과는 다음과 같습니다.

这是一段带有HTML标签的文本,这是链接。
로그인 후 복사
로그인 후 복사
로그인 후 복사

이 코드는 "<"와 ">" 사이의 모든 문자와 일치하며 대체됩니다. 빈 문자열로 처리하세요.

3. HTML을 제거하려면 DOMDocument 클래스를 사용하세요

위의 두 가지 방법 외에도 PHP의 DOMDocument 클래스를 사용하여 HTML 태그를 제거할 수도 있습니다. 이 방법의 장점은 불규칙한 HTML 코드로 인해 발생하는 구문 분석 오류를 방지할 수 있다는 것입니다. 샘플 코드는 다음과 같습니다.

$html = '<p>这是一段带有HTML标签的文本,<a href="https://www.example.com">这是链接</a>。</p>';

$dom = new DOMDocument(); // 创建一个DOMDocument对象
$dom->loadHTML($html); // 将HTML字符串加载到对象中

echo $dom->textContent; // 输出内容
로그인 후 복사

출력 결과는 다음과 같습니다.

这是一段带有HTML标签的文本,这是链接。
로그인 후 복사
로그인 후 복사
로그인 후 복사

DOMDocument 클래스는 HTML 코드를 DOM 트리로 구문 분석한 다음 이 클래스에서 제공하는 메서드를 사용하여 DOM 트리의 요소를 작동할 수 있습니다. 예를 들어 요소의 태그 이름과 속성을 가져오는 등의 작업을 수행합니다.

요약

HTML 태그는 위의 세 가지 방법을 통해 쉽게 제거할 수 있지만 실제 필요에 따라 현재 시나리오에 더 적합한 방법을 선택해야 합니다. HTML 코드가 상대적으로 표준화된 경우에는 더 빠르기 때문에 Strip_tags 함수나 정규 표현식 방법을 사용하는 것이 좋습니다. 더 많은 유연성이 필요한 경우 HTML 코드를 구문 분석하기 위해 DOMDocument 클래스를 사용하는 것이 좋습니다.

위 내용은 PHP에서 HTML 태그를 제거하는 방법(3가지 방법)의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿