Web サイトは Selenium 自動化をどのように検出し、どのように回避できるのでしょうか?
Web サイトによる Selenium の検出
Selenium と Chromedriver はブラウザの自動化を提供しますが、一部の Web サイトは Selenium インスタンスの使用を検出する機能を備えています。明示的な自動化がないにもかかわらず。この機能により、これらの Web サイトがこの検出をどのように実行するかという疑問が生じます。
検出技術
Web サイトは、Selenium の存在を識別するためにさまざまな技術を採用しています。一般的な方法の 1 つは、Selenium が動作しているときに出現する事前定義された JavaScript 変数を調べることです。これらの変数には、「selenium」または「webdriver」という用語が含まれることが多く、$cdc_ や $wdc_ などのウィンドウ オブジェクトやドキュメント変数で検出できます。検出メカニズムは、使用されているブラウザによって異なります。
対策
Web サイトの検出を回避する 1 つのアプローチは、特定の JavaScript 変数の存在を削除または変更することです。たとえば、Chrome では、chromedriver のソース コードを変更して $cdc_ を別の変数名に変更することが効果的であることがわかっています。
ボット検出用の擬似コード
いくつかボット ネットワークは、複雑なアルゴリズムを利用して Selenium の使用を検出する場合があります。次の疑似コードは、潜在的な検出手法を垣間見ることができます:
runBotDetection = function () { // Check for window-specific detection keys for (windowDetectionKey in windowDetectionKeys) { if (window[windowDetectionKeyValue]) { return true; } } // Check for document-specific detection keys for (documentDetectionKey in documentDetectionKeys) { if (window['document'][documentDetectionKeyValue]) { return true; } } // Inspect document for specific patterns for (documentKey in window['document']) { if (documentKey.match(/$[a-z]dc_/) && window['document'][documentKey]['cache_']) { return true; } } // Check for additional external indicators if (window['external'] && window['external'].toString() && (window['external'].toString()['indexOf']('Sequentum') != -1)) return true; // Examine HTML element attributes if (window['document']['documentElement']['getAttribute']('selenium')) return true; if (window['document']['documentElement']['getAttribute']('webdriver')) return true; if (window['document']['documentElement']['getAttribute']('driver')) return true; return false; };
追加のメソッド
JavaScript 変数の変更に加えて、Selenium の検出を回避するための他の手法には次のものがあります。
- を使用するVPN: VPN はユーザーの IP アドレスを一時的にマスクできますが、その後のリクエスト後に検出される可能性があります。
- ユーザー エージェントの変更: ユーザー エージェント文字列を変更すると、Web ブラウザーが通常のユーザーのように表示されます。
- ブラウザ プラグインの無効化: 特定のプラグインSelenium の存在を明らかにする可能性のある情報が公開される可能性があります。
- ヘッダーの変更: HTTP ヘッダーを操作して、一般的なユーザーのトラフィックに近づけることができます。
- プロキシの使用サーバー: プロキシ サーバーは、ユーザーの接続。
以上がWeb サイトは Selenium 自動化をどのように検出し、どのように回避できるのでしょうか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック









JavaScript文字列置換法とFAQの詳細な説明 この記事では、javaScriptの文字列文字を置き換える2つの方法について説明します:内部JavaScriptコードとWebページの内部HTML。 JavaScriptコード内の文字列を交換します 最も直接的な方法は、置換()メソッドを使用することです。 str = str.replace( "find"、 "置換"); この方法は、最初の一致のみを置き換えます。すべての一致を置き換えるには、正規表現を使用して、グローバルフラグGを追加します。 str = str.replace(/fi

記事では、JavaScriptライブラリの作成、公開、および維持について説明し、計画、開発、テスト、ドキュメント、およびプロモーション戦略に焦点を当てています。

この記事では、ブラウザでJavaScriptのパフォーマンスを最適化するための戦略について説明し、実行時間の短縮、ページの負荷速度への影響を最小限に抑えることに焦点を当てています。

フロントエンドのサーマルペーパーチケット印刷のためのよくある質問とソリューションフロントエンド開発におけるチケット印刷は、一般的な要件です。しかし、多くの開発者が実装しています...

この記事では、ブラウザ開発者ツールを使用した効果的なJavaScriptデバッグについて説明し、ブレークポイントの設定、コンソールの使用、パフォーマンスの分析に焦点を当てています。

この記事では、スクリプトのパフォーマンスを大幅に向上させるための10の簡単な手順の概要を説明します。 これらの手法は簡単で、すべてのスキルレベルに適用できます。 更新の維持:NPMのようなパッケージマネージャーを使用して、Viteなどのバンドラーを使用して確認してください

Sequelizeは、約束ベースのnode.js ormです。 PostgreSQL、MySQL、MariadB、SQLite、およびMSSQLで使用できます。このチュートリアルでは、Webアプリのユーザー向けに認証を実装します。また、人気のある認証ミドルであるPassportを使用します

この記事では、jQueryライブラリを使用してシンプルな画像カルーセルを作成するように導きます。 jQuery上に構築されたBXSLiderライブラリを使用し、カルーセルをセットアップするために多くの構成オプションを提供します。 今日、絵のカルーセルはウェブサイトで必須の機能になっています - 1つの写真は千の言葉よりも優れています! 画像カルーセルを使用することを決定した後、次の質問はそれを作成する方法です。まず、高品質の高解像度の写真を収集する必要があります。 次に、HTMLとJavaScriptコードを使用して画像カルーセルを作成する必要があります。ウェブ上には、さまざまな方法でカルーセルを作成するのに役立つ多くのライブラリがあります。オープンソースBXSLiderライブラリを使用します。 BXSLiderライブラリはレスポンシブデザインをサポートしているため、このライブラリで構築されたカルーセルは任意のものに適合させることができます
