首页 > web前端 > js教程 > 网站如何检测 Selenium 自动化,以及如何规避?

网站如何检测 Selenium 自动化,以及如何规避?

Linda Hamilton
发布: 2024-12-17 22:38:19
原创
879 人浏览过

How Do Websites Detect Selenium Automation, and How Can It Be Circumvented?

网站的 Selenium 检测

虽然 Selenium 与 Chromedriver 提供浏览器自动化,但某些网站具有检测何时使用 selenium 实例的能力,尽管没有明确的自动化。这种能力提出了这些网站如何完成这种检测的问题。

检测技术

网站采用各种技术来识别 Selenium 的存在。一种流行的方法是检查 Selenium 运行时出现的预定义 JavaScript 变量。这些变量经常包含术语“selenium”或“webdriver”,并且可以在窗口对象和文档变量(例如 $cdc_ 和 $wdc_)中检测到。检测机制因所使用的浏览器而异。

对策

要规避网站检测,一种方法是消除或更改特定 JavaScript 变量的存在。例如,在 Chrome 中,修改 chromedriver 源代码以将 $cdc_ 更改为不同的变量名称已被发现是有效的。

用于机器人检测的伪代码

一些机器人网络可能会利用复杂的算法来检测 Selenium 的使用情况。以下伪代码让我们一睹潜在的检测技术:

runBotDetection = function () {

    // Check for window-specific detection keys
    for (windowDetectionKey in windowDetectionKeys) {
        if (window[windowDetectionKeyValue]) {
            return true;
        }
    }

    // Check for document-specific detection keys
    for (documentDetectionKey in documentDetectionKeys) {
        if (window['document'][documentDetectionKeyValue]) {
            return true;
        }
    }

    // Inspect document for specific patterns
    for (documentKey in window['document']) {
        if (documentKey.match(/$[a-z]dc_/) && window['document'][documentKey]['cache_']) {
            return true;
        }
    }

    // Check for additional external indicators
    if (window['external'] && window['external'].toString() && (window['external'].toString()['indexOf']('Sequentum') != -1)) return true;

    // Examine HTML element attributes
    if (window['document']['documentElement']['getAttribute']('selenium')) return true;
    if (window['document']['documentElement']['getAttribute']('webdriver')) return true;
    if (window['document']['documentElement']['getAttribute']('driver')) return true;

    return false;
};
登录后复制

其他方法

除了更改 JavaScript 变量之外,其他逃避 Selenium 检测的技术还包括:

  • 使用 VPN:VPN 可以暂时屏蔽用户的 IP 地址,但在后续请求后可能会被检测到。
  • 修改用户代理:更改用户代理字符串可以使网络浏览器看起来像普通用户。
  • 禁用浏览器插件:某些插件可能会泄露可能泄露 Selenium 的信息
  • 修改标头:可以操纵 HTTP 标头,使其看起来更类似于典型用户的流量。
  • 使用代理服务器:代理服务器可以进一步匿名化用户的连接。

以上是网站如何检测 Selenium 自动化,以及如何规避?的详细内容。更多信息请关注PHP中文网其他相关文章!

来源:php.cn
本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
作者最新文章
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板