BeautifulSoup으로 HREF 속성 추출
이 시나리오에서는 다음 HTML 콘텐츠에서 "some_url" href 속성을 추출하려고 합니다.
<code class="html"><a href="some_url">next</a> <span class="class">...</span></code>
BeautifulSoup의 find_all() 메소드 활용
이 특정 속성을 검색하려면 다음과 같이 find_all() 메소드를 사용하세요.
<code class="python">from bs4 import BeautifulSoup html = '''<a href="some_url">next</a> <span class="class"><a href="another_url">later</a></span>''' soup = BeautifulSoup(html) for a in soup.find_all('a', href=True): print("Found the URL:", a['href'])</code>
Python 2에서 Python 3으로의 호환성
이 코드는 Python 2와 Python 3 모두에서 작동합니다. 그러나 이전 버전의 BeautifulSoup(버전 4 이전)에서는 find_all() 메서드가 이름은 findAll입니다.
HREF 속성이 있는 모든 태그 검색
태그 이름에 관계없이 href 속성을 보유한 모든 태그를 검색하려면 태그 이름 매개변수:
<code class="python">href_tags = soup.find_all(href=True)</code>
위 내용은 Python에서 BeautifulSoup을 사용하여 \'href\' 속성을 추출하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!