使用 Python 中的 Selenium 繞過機器人偵測軟體

Mary-Kate Olsen
發布: 2024-11-04 18:06:02
原創
262 人瀏覽過

Bypassing Bot Detection Software with Selenium in Python

(使用風險自負,我不會縱容任何非法行為)

Amazon 等網站使用 Imperva 和 FingerprintJS 等機器人偵測軟體來阻止自動化工具與其網站互動。他們這樣做是正確的,以防止網路爬蟲和駭客竊取他們的寶貴資料。

如果他們知道...

如果您知道自己在做什麼,那麼很容易繞過這些安全控制。

我們可以透過幾種方法繞過這些安全控制:

  • 輪換代理
  • 使用cookie
  • 輪換用戶代理與 HTTP 標頭
  • 網路驅動程式中的遠端 Javascript 簽章(我們很快就會探索這個!?)
  • 與網站互動時避免模式

如果您正在使用 Selenium 並且您被自動化軟體阻止。

我們可以實現一個小技巧,可以省去設定旋轉代理、標頭或用戶代理的麻煩。

禁用 Selenium 自動化標誌

但這裡有另一種更簡單的方法可以解決這個問題 - 停用 Selenium 的自動化標誌。

Selenium 預設啟用自動化標誌,這可能會阻止您使用反機器人軟體造訪網站。

要繞過該區塊,您必須在 Selenium 程式碼中停用這些自動化標誌,讓我們看看如何使用簡單的一個襯墊來做到這一點。

首先,我們呼叫 webdriver.Chromeoptions() 函數並將其實例化為一個名為 options 的變數。

這使我們能夠為網路驅動程式添加自訂選項:

選項= webdriver.ChromeOptions

現在,讓我們透過將以下行新增到我們的 Selenium 程式碼中來新增禁用自動化標誌的選項:

options.add_argument("--disable-blink-features=AutomationControlled")

這個簡單的一行程式碼會停用自動化標誌,並告訴網站您不是機器人。

以上是使用 Python 中的 Selenium 繞過機器人偵測軟體的詳細內容。更多資訊請關注PHP中文網其他相關文章!

來源:dev.to
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
作者最新文章
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板
關於我們 免責聲明 Sitemap
PHP中文網:公益線上PHP培訓,幫助PHP學習者快速成長!