Python에서 Selenium을 사용하여 봇 탐지 소프트웨어 우회

Mary-Kate Olsen
풀어 주다: 2024-11-04 18:06:02
원래의
318명이 탐색했습니다.

Bypassing Bot Detection Software with Selenium in Python

(본인의 책임하에 사용하세요. 불법적인 행위를 용납하지 않습니다.)

Amazon과 같은 웹사이트에서는 Imperva 및 FingerprintJS와 같은 봇 탐지 소프트웨어를 사용하여 자동화된 도구가 웹사이트와 상호 작용하는 것을 차단합니다. 그리고 웹 스크래퍼와 해커가 귀중한 데이터를 훔치는 것을 방지하기 위해 그렇게 하는 것이 옳습니다.

그들이 알았더라면...

이러한 보안 통제는 자신이 무엇을 하고 있는지 알면 우회하기 매우 쉽습니다.

보안 통제를 우회할 수 있는 몇 가지 방법이 있습니다.

  • 프록시 순환
  • 쿠키 사용
  • 사용자 에이전트 및 HTTP 헤더 순환
  • 웹 드라이버의 원격 Javascript 서명(이 내용은 곧 살펴보겠습니다! ?)
  • 웹사이트 상호작용 시 패턴 피하기

Selenium을 사용하고 있는데 자동화 소프트웨어에 의해 차단되는 경우

교대 프록시, 헤더 또는 사용자 에이전트를 설정하는 번거로움을 덜어줄 수 있는 작은 트릭을 구현할 수 있습니다.

Selenium 자동화 플래그 비활성화

하지만 Selenium의 자동화 플래그를 비활성화하는 또 다른 간단한 방법이 있습니다.

Selenium에는 기본적으로 안티 봇 소프트웨어를 사용하여 웹사이트에 액세스하는 것을 차단할 수 있는 자동화 플래그가 활성화되어 있습니다.

블록을 우회하려면 Selenium 코드에서 자동화 플래그를 비활성화해야 합니다. 간단한 한 줄을 사용하여 이를 수행하는 방법을 살펴보겠습니다.

먼저 webdriver.Chromeoptions() 함수를 호출하고 options라는 변수에 인스턴스화하겠습니다.

이를 통해 웹 드라이버에 사용자 정의 옵션을 추가할 수 있습니다.

옵션 = webdriver.ChromeOptions

이제 Selenium 코드에 다음 줄을 추가하여 자동화 플래그를 비활성화하는 옵션을 추가해 보겠습니다.

options.add_argument("--disable-blink-features=AutomationControlled")

이 간단한 한 줄로 자동화 플래그를 비활성화하고 웹사이트에 귀하가 봇이 아님을 알립니다.

위 내용은 Python에서 Selenium을 사용하여 봇 탐지 소프트웨어 우회의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:dev.to
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿