Python の Selenium を使用したボット検出ソフトウェアのバイパス

Mary-Kate Olsen
リリース: 2024-11-04 18:06:02
オリジナル
339 人が閲覧しました

Bypassing Bot Detection Software with Selenium in Python

(違法行為を容認するわけではありませんので、自己責任でご使用ください)

Amazon などの Web サイトは、Imperva や FingerprintJS などのボット検出ソフトウェアを使用して、自動ツールが Web サイトと対話するのをブロックします。そして、ウェブスクレーパーやハッカーが貴重なデータを盗むのを防ぐために、彼らは当然のことを行っています。

彼らが知っていれば...

これらのセキュリティ制御は、自分が何をしているのかを知っていれば、非常に簡単に回避できます。

これらのセキュリティ制御を回避できる方法はいくつかあります:

  • プロキシをローテーションする
  • Cookie の使用
  • ユーザー エージェントと HTTP ヘッダーをローテーションする
  • WebドライバーのリモートJavaScript署名(これについてはすぐに調べます! ?)
  • Web サイトを操作する際のパターンの回避

Selenium を使用していて、自動化ソフトウェアによってブロックされている場合。

ローテーションプロキシ、ヘッダー、またはユーザーエージェントを設定する手間を省くために実装できるちょっとしたトリックがあります。

Selenium 自動化フラグを無効にする

しかし、これを解決できるかもしれないもう 1 つの簡単な方法は、Selenium の自動化フラグを無効にすることです。

Selenium ではデフォルトで自動化フラグが有効になっており、ボット対策ソフトウェアを使用した Web サイトへのアクセスがブロックされる可能性があります。

ブロックをバイパスするには、Selenium コードで自動化フラグを無効にする必要があります。簡単なワンライナーを使用してそれを行う方法を見てみましょう。

まず、webdriver.Chromeoptions() 関数を呼び出して、options という変数にインスタンス化します。

これにより、Web ドライバーにカスタム オプションを追加できるようになります:

オプション = webdriver.ChromeOptions

次に、Selenium コードに次の行を追加して、自動化フラグを無効にするオプションを追加しましょう。

options.add_argument("--disable-blink-features=AutomationControlled")

この簡単なワンライナーは自動化フラグを無効にし、あなたがボットではないことを Web サイトに伝えます。

以上がPython の Selenium を使用したボット検出ソフトウェアのバイパスの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ソース:dev.to
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
著者別の最新記事
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート