> 백엔드 개발 > C++ > 정규식을 사용하여 모든 HTML 태그를 효율적으로 제거하려면 어떻게 해야 합니까?

정규식을 사용하여 모든 HTML 태그를 효율적으로 제거하려면 어떻게 해야 합니까?

Mary-Kate Olsen
풀어 주다: 2025-01-06 04:47:39
원래의
265명이 탐색했습니다.

How Can I Efficiently Remove All HTML Tags Using Regular Expressions?

HTML 태그를 효율적으로 제거하는 정규 표현식

정규 표현식을 사용하여 HTML 태그를 제거하려고 할 때 뒤에 남는 문제를 해결하는 것이 중요합니다. 닫는 태그. 이 문서는 이 문제에 대한 효율적인 솔루션을 제공합니다.

제공된 코드:

string sPattern = @"<\/?!?(img|a)[^>]*>";
Regex rgx = new Regex(sPattern);
로그인 후 복사

처음 나타나는 그리고 태그를 삭제했지만 닫는 태그를 제거하지 못했습니다.

원하는 결과를 얻으려면 정규식을 다음과 같이 수정해야 합니다.

string sPattern = @"<\/?[^>]*>";
로그인 후 복사

이 업데이트된 패턴은 태그에 관계없이 모든 HTML 태그와 일치합니다. 입력하고 여는 태그와 닫는 태그를 모두 제거합니다.

또한 제공되는 코드는 다음 그림과 같이 Trim 및 바꾸기와 같은 문자열 방법을 활용하여 단순화할 수 있습니다. 다음:

string removeTags(string input)
{
    return input.Replace("<[^>]*>", "")
                .Replace("\s+", " ")
                .Trim();
}
로그인 후 복사

이 기능은 모든 HTML 태그를 효율적으로 제거하고, 여러 공백을 단일 공백으로 바꾸고, 선행 또는 후행 공백을 자릅니다.

위 내용은 정규식을 사용하여 모든 HTML 태그를 효율적으로 제거하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿