Python으로 HTML 구문 분석
질문:
HTML 요소에 어떻게 액세스하고 조작할 수 있나요? Python 파서를 사용하시나요? Firefox의 "요소 검사" 기능에 표시되는 중첩 구조와 유사한 구조화된 형식으로 태그와 해당 콘텐츠를 가져올 수 있는 모듈이 필요합니다.
답변:
BeautifulSoup
BeautifulSoup 모듈은 인기 있고 강력한 Python 라이브러리입니다. HTML을 파싱하기 위한 것입니다. HTML을 중첩된 데이터 구조로 변환하여 HTML 요소에 쉽게 액세스하고 탐색할 수 있습니다.
예:
제공한 HTML 문서를 구문 분석하려면:
from bs4 import BeautifulSoup html = "<html><head>Heading</head><body attr1='val1'><div class='container'><div>
"body" 내의 "container" div 내용을 가져오려면 태그:
print(parsed_html.body.find('div', attrs={'class':'container'}).text)
기타 옵션:
위 내용은 Python을 사용하여 HTML 및 액세스 요소를 어떻게 구문 분석할 수 있습니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!