サイトのログインと Cookie の処理に Jsoup を使用する
認証を必要とする Web サイトを操作する場合、有効な情報を維持するために Cookie を利用する必要があります。セッションを実行し、後続のページにアクセスします。 Java Web スクレイピング用の人気のあるライブラリである Jsoup は、スクレイピング プロセス中に Cookie を管理するための効率的なメカニズムを提供します。
ログインに成功した後に Cookie を設定し、後続のページ リクエストでそれを利用するには、次の手順に従います。
Connection.Response res = Jsoup.connect("http://www.example.com/login.php") .data("username", "myUsername", "password", "myPassword") .method(Method.POST) .execute(); String sessionId = res.cookie("SESSIONID"); // Retrieve the session ID cookie
Document doc2 = Jsoup.connect("http://www.example.com/otherPage") .cookie("SESSIONID", sessionId) .get();
Jsoup の Cookie 処理機能を使用すると、最初のログイン プロセスの後でも、認証された Web サイトに効率的に移動し、複数のページから情報を取得できます。
以上がJsoup を使用してサイトのログイン用の Cookie を処理し、後続のページにアクセスするにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。