网站的 Selenium 检测
虽然 Selenium 与 Chromedriver 提供浏览器自动化,但某些网站具有检测何时使用 selenium 实例的能力,尽管没有明确的自动化。这种能力提出了这些网站如何完成这种检测的问题。
检测技术
网站采用各种技术来识别 Selenium 的存在。一种流行的方法是检查 Selenium 运行时出现的预定义 JavaScript 变量。这些变量经常包含术语“selenium”或“webdriver”,并且可以在窗口对象和文档变量(例如 $cdc_ 和 $wdc_)中检测到。检测机制因所使用的浏览器而异。
对策
要规避网站检测,一种方法是消除或更改特定 JavaScript 变量的存在。例如,在 Chrome 中,修改 chromedriver 源代码以将 $cdc_ 更改为不同的变量名称已被发现是有效的。
用于机器人检测的伪代码
一些机器人网络可能会利用复杂的算法来检测 Selenium 的使用情况。以下伪代码让我们一睹潜在的检测技术:
runBotDetection = function () { // Check for window-specific detection keys for (windowDetectionKey in windowDetectionKeys) { if (window[windowDetectionKeyValue]) { return true; } } // Check for document-specific detection keys for (documentDetectionKey in documentDetectionKeys) { if (window['document'][documentDetectionKeyValue]) { return true; } } // Inspect document for specific patterns for (documentKey in window['document']) { if (documentKey.match(/$[a-z]dc_/) && window['document'][documentKey]['cache_']) { return true; } } // Check for additional external indicators if (window['external'] && window['external'].toString() && (window['external'].toString()['indexOf']('Sequentum') != -1)) return true; // Examine HTML element attributes if (window['document']['documentElement']['getAttribute']('selenium')) return true; if (window['document']['documentElement']['getAttribute']('webdriver')) return true; if (window['document']['documentElement']['getAttribute']('driver')) return true; return false; };
其他方法
除了更改 JavaScript 变量之外,其他逃避 Selenium 检测的技术还包括:
以上是网站如何检测 Selenium 自动化,以及如何规避?的详细内容。更多信息请关注PHP中文网其他相关文章!