Jsoup zur Verwaltung von Sitzungscookies verwenden
Bei der Authentifizierung bei einer Website mit jsoup ist die Beibehaltung des Sitzungscookies über mehrere Seitenanfragen hinweg von entscheidender Bedeutung. Durch die Integration dieses Ansatzes können nachfolgende Seitenanfragen mit der entsprechenden Autorisierung erfolgen.
Um das Sitzungscookie nach einer erfolgreichen Anmeldung zu erhalten, verwenden Sie das folgende Code-Snippet:
<code class="java">Connection.Response res = Jsoup.connect("http://www.example.com/login.php") .data("username", "myUsername", "password", "myPassword") .method(Method.POST) .execute(); Document doc = res.parse(); String sessionId = res.cookie("SESSIONID"); // verify the correct cookie name</code>
Nach der Sitzung Wenn ein Cookie abgerufen wird, müssen nachfolgende Seitenanfragen es enthalten:
<code class="java">Document doc2 = Jsoup.connect("http://www.example.com/otherPage") .cookie("SESSIONID", sessionId) .get();</code>
Durch die Einhaltung dieser Schritte kann jsoup effektiv zum Scrapen und Sammeln von Informationen aus authentifizierten Webseiten verwendet werden, ohne auf externe Bibliotheken wie Apache httpclient zurückgreifen zu müssen.
Das obige ist der detaillierte Inhalt vonWie kann ich Sitzungscookies für das Website-Scraping mit Jsoup verwalten?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!