ログイン後の Web サイトスクレイピングのために Jsoup で投稿リクエストと Cookie を処理するにはどうすればよいですか?

Barbara Streisand
リリース: 2024-10-29 04:01:29
オリジナル
323 人が閲覧しました

How to Handle Post Requests and Cookies in Jsoup for Website Scraping After Login?

jsoup での投稿リクエストと Cookie の処理

ログイン後に Web サイトをスクレイピングしようとすると、次のものが不足しているために問題が発生するのが一般的です。クッキー。認証されたセッションを維持するために、Web サイトは通常、ログイン中に Cookie を設定します。

jsoup では、ログイン リクエストが成功した後、Connection.Response オブジェクトを使用して、後続のリクエストに使用されるセッション Cookie を取得できます。

<code class="java">Connection.Response res = Jsoup.connect("http://www.example.com/login.php")
    .data("username", "myUsername", "password", "myPassword")
    .method(Method.POST)
    .execute();</code>
ログイン後にコピー

応答を取得したら、セッション Cookie にアクセスできます。セッション Cookie には通常、「SESSIONID」のような名前が付いています。

<code class="java">String sessionId = res.cookie("SESSIONID");</code>
ログイン後にコピー

以降のページ リクエストは、セッション Cookie を使用して作成する必要があります。 session:

<code class="java">Document doc2 = Jsoup.connect("http://www.example.com/otherPage")
    .cookie("SESSIONID", sessionId)
    .get();</code>
ログイン後にコピー

Cookie 処理を jsoup コードに組み込むことで、ログイン後に Web サイトの後続のページに正常に移動してスクレイピングできます。

以上がログイン後の Web サイトスクレイピングのために Jsoup で投稿リクエストと Cookie を処理するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
著者別の最新記事
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート
私たちについて 免責事項 Sitemap
PHP中国語ウェブサイト:福祉オンライン PHP トレーニング,PHP 学習者の迅速な成長を支援します!