웹 스크래핑을 위해 Python urllib2에서 사용자 정의 사용자 에이전트를 설정하는 방법은 무엇입니까?

Patricia Arquette
풀어 주다: 2024-11-01 08:54:02
원래의
526명이 탐색했습니다.

How to Set Custom User Agents in Python urllib2 for Web Scraping?

urllib2에서 사용자 에이전트 설정

웹 스크래핑을 위해 urllib2.urlopen을 사용하는 동안 기본 사용자 에이전트는 일반적으로 다음과 같습니다. Python 패키지 이름. 웹사이트는 사용자 에이전트에 따라 제한을 시행할 수 있으므로 이는 항상 바람직하지 않을 수 있습니다. 사용자 에이전트를 수정하려면 사용자 정의 urllib2 오프너를 활용할 수 있습니다.

Python 2.x에서는 urllib2.build_opener를 사용하여 새 오프너를 만들 수 있습니다. 사용자 에이전트를 포함한 사용자 정의 헤더. 다음 코드 조각은 사용자 에이전트를 Mozilla로 변경하는 방법을 보여줍니다.

opener = urllib2.build_opener()
opener.addheaders = [('User-Agent', 'Mozilla/5.0')]
response = opener.open('http://www.stackoverflow.com')
로그인 후 복사

Python 3에서 urllib2.build_opener에 해당하는 것은 urllib.request.build_opener. 동일한 코드 구조를 사용하여 Python 3에서도 사용자 정의 사용자 에이전트를 설정할 수 있습니다.

위 내용은 웹 스크래핑을 위해 Python urllib2에서 사용자 정의 사용자 에이전트를 설정하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿