> 백엔드 개발 > 파이썬 튜토리얼 > Regex를 사용하여 텍스트 문자열에서 HTML과 유사한 태그를 효율적으로 제거할 수 있습니까?

Regex를 사용하여 텍스트 문자열에서 HTML과 유사한 태그를 효율적으로 제거할 수 있습니까?

Linda Hamilton
풀어 주다: 2024-11-30 06:27:19
원래의
152명이 탐색했습니다.

How Can Regex be Used to Efficiently Remove HTML-like Tags from Text Strings?

문자열 대체를 위한 정규식 구문 분석

이 코드의 목표는 입력 텍스트에서 HTML과 유사한 특정 태그를 제거하는 것입니다. 입력에는 다음과 같은 줄이 포함됩니다.

this is a paragraph with<[1> in between</[1> and then there are cases ... where the<[99> number ranges from 1-100</[99>.
로그인 후 복사

원하는 출력은 다음과 같습니다.

this is a paragraph with in between and then there are cases ... where the number ranges from 1-100.
로그인 후 복사
로그인 후 복사

이를 달성하려면 Python의 re 모듈에서 정규식(regex)을 활용할 수 있습니다.

Regex와 함께 re.sub 사용

다음 코드 스니펫은 re.sub를 사용하여 원하는 교체를 수행합니다.

import re
line = re.sub(r"</?\[\d+>", "", line)
로그인 후 복사

이 정규 표현식은 입력 줄에서 HTML과 유사한 태그가 일치하는 경우 이를 제거합니다.

정규 표현식 설명:

  • [는 [(태그의 시작)과 일치합니다.
  • d는 하나 이상의 숫자와 일치합니다.
  • > 일치 > (태그 끝).
  • ? / 뒤에 오는 슬래시는 선택 사항입니다.

출력 예:

입력 줄에 적용하면 출력은 다음과 같습니다.

this is a paragraph with in between and then there are cases ... where the number ranges from 1-100.
로그인 후 복사
로그인 후 복사

결론:

이것 이 접근 방식을 사용하면 특정 태그 번호를 하드 코딩하지 않고도 HTML과 유사한 태그를 동적으로 교체할 수 있습니다. 정규식 구문은 문자열 조작 및 텍스트 구문 분석을 위한 강력한 도구를 제공합니다.

위 내용은 Regex를 사용하여 텍스트 문자열에서 HTML과 유사한 태그를 효율적으로 제거할 수 있습니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿