首頁 > Java > java教程 > 主體

如何使用 Jsoup 維護網站抓取的會話 Cookie?

Linda Hamilton
發布: 2024-10-29 00:50:30
原創
861 人瀏覽過

How Can I Maintain Session Cookies for Website Scraping with Jsoup?

使用 jsoup 維護會話 Cookie

使用 jsoup 向網站進行身份驗證時,跨多個頁面請求維護會話 Cookie 至關重要。透過採用這種方法,可以在適當的授權下發出後續頁面請求。

要在成功登入後取得會話cookie,請使用以下程式碼片段:

<code class="java">Connection.Response res = Jsoup.connect("http://www.example.com/login.php")
    .data("username", "myUsername", "password", "myPassword")
    .method(Method.POST)
    .execute();

Document doc = res.parse();
String sessionId = res.cookie("SESSIONID"); // verify the correct cookie name</code>
登入後複製

一旦會話取得cookie 後,後續頁面要求必須包含它:

<code class="java">Document doc2 = Jsoup.connect("http://www.example.com/otherPage")
    .cookie("SESSIONID", sessionId)
    .get();</code>
登入後複製

透過遵循以下步驟,jsoup 可以有效地用於從經過身份驗證的網頁中抓取和收集信息,而無需借助apache httpclient 等外部庫。

以上是如何使用 Jsoup 維護網站抓取的會話 Cookie?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

來源:php.cn
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
作者最新文章
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板