HTML 태그를 효율적으로 제거하는 정규 표현식
정규 표현식을 사용하여 HTML 태그를 제거하려고 할 때 뒤에 남는 문제를 해결하는 것이 중요합니다. 닫는 태그. 이 문서는 이 문제에 대한 효율적인 솔루션을 제공합니다.
제공된 코드:
string sPattern = @"<\/?!?(img|a)[^>]*>"; Regex rgx = new Regex(sPattern);
처음 나타나는 그리고 태그를 삭제했지만 닫는 태그를 제거하지 못했습니다.
원하는 결과를 얻으려면 정규식을 다음과 같이 수정해야 합니다.
string sPattern = @"<\/?[^>]*>";
이 업데이트된 패턴은 태그에 관계없이 모든 HTML 태그와 일치합니다. 입력하고 여는 태그와 닫는 태그를 모두 제거합니다.
또한 제공되는 코드는 다음 그림과 같이 Trim 및 바꾸기와 같은 문자열 방법을 활용하여 단순화할 수 있습니다. 다음:
string removeTags(string input) { return input.Replace("<[^>]*>", "") .Replace("\s+", " ") .Trim(); }
이 기능은 모든 HTML 태그를 효율적으로 제거하고, 여러 공백을 단일 공백으로 바꾸고, 선행 또는 후행 공백을 자릅니다.
위 내용은 정규식을 사용하여 모든 HTML 태그를 효율적으로 제거하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!