Rumah > Java > javaTutorial > teks badan

Bagaimana Saya Boleh Mengekalkan Kuki Sesi untuk Mengikis Laman Web dengan Jsoup?

Linda Hamilton
Lepaskan: 2024-10-29 00:50:30
asal
851 orang telah melayarinya

How Can I Maintain Session Cookies for Website Scraping with Jsoup?

Menggunakan jsoup untuk Mengekalkan Kuki Sesi

Apabila mengesahkan ke tapak web dengan jsoup, mengekalkan kuki sesi merentas berbilang permintaan halaman adalah penting. Dengan menggabungkan pendekatan ini, permintaan halaman seterusnya boleh dibuat dengan kebenaran yang sepatutnya.

Untuk memperoleh kuki sesi selepas log masuk berjaya, gunakan coretan kod berikut:

<code class="java">Connection.Response res = Jsoup.connect("http://www.example.com/login.php")
    .data("username", "myUsername", "password", "myPassword")
    .method(Method.POST)
    .execute();

Document doc = res.parse();
String sessionId = res.cookie("SESSIONID"); // verify the correct cookie name</code>
Salin selepas log masuk

Setelah sesi cookie diperolehi, permintaan halaman berikutnya mesti memasukkannya:

<code class="java">Document doc2 = Jsoup.connect("http://www.example.com/otherPage")
    .cookie("SESSIONID", sessionId)
    .get();</code>
Salin selepas log masuk

Dengan mematuhi langkah-langkah ini, jsoup boleh digunakan dengan berkesan untuk mengikis dan mengumpul maklumat daripada halaman web yang disahkan, tanpa menggunakan perpustakaan luaran seperti apache httpclient.

Atas ialah kandungan terperinci Bagaimana Saya Boleh Mengekalkan Kuki Sesi untuk Mengikis Laman Web dengan Jsoup?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

sumber:php.cn
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Artikel terbaru oleh pengarang
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan