> 백엔드 개발 > 파이썬 튜토리얼 > Python의 문자열에서 HTML 태그를 제거하는 방법은 무엇입니까?

Python의 문자열에서 HTML 태그를 제거하는 방법은 무엇입니까?

Linda Hamilton
풀어 주다: 2024-12-04 01:00:11
원래의
589명이 탐색했습니다.

How to Remove HTML Tags from Strings in Python?

Python의 문자열에서 HTML 형식 제거

형식 태그를 표시하지 않고 HTML 문서의 내용을 추출하는 작업을 고려해 보세요. 예를 들어, HTML 요소 일부 텍스트 "일부 텍스트"만 출력해야 하며 hello "hello"를 표시해야 합니다.

솔루션

내장된 Python 라이브러리는 이 목표를 달성하는 데 유용한 메커니즘을 제공합니다.

Python 3:

from io import StringIO
from html.parser import HTMLParser

class MLStripper(HTMLParser):
    def __init__(self):
        super().__init__()
        self.reset()
        self.strict = False
        self.convert_charrefs= True
        self.text = StringIO()
    def handle_data(self, d):
        self.text.write(d)
    def get_data(self):
        return self.text.getvalue()

def strip_tags(html):
    s = MLStripper()
    s.feed(html)
    return s.get_data()
로그인 후 복사

Python의 경우 2:

from HTMLParser import HTMLParser
from StringIO import StringIO

class MLStripper(HTMLParser):
    def __init__(self):
        self.reset()
        self.text = StringIO()
    def handle_data(self, d):
        self.text.write(d)
    def get_data(self):
        return self.text.getvalue()

def strip_tags(html):
    s = MLStripper()
    s.feed(html)
    return s.get_data()
로그인 후 복사

위 내용은 Python의 문자열에서 HTML 태그를 제거하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿