Permintaan untuk Halaman Didayakan Javascript
Permintaan ialah perpustakaan HTTP yang berkuasa untuk Python, tetapi ia bergelut untuk mengekstrak kandungan daripada tapak web yang sangat bergantung pada JavaScript. Ini kerana JavaScript biasanya berjalan pada bahagian klien, menjana kandungan secara dinamik selepas pemuatan halaman awal.
Penyelesaian: Permintaan-HTML
Nasib baik, komuniti Permintaan telah dibangunkan penyelesaian: requests-html. Modul ini menambah keupayaan pemaparan JavaScript pada Permintaan, membolehkan anda berinteraksi dengan halaman yang menggunakan JavaScript.
Penggunaan:
Untuk menggunakan Permintaan-HTML:
Rendering JavaScript:
Mengakses Kandungan:
Selepas memberikan JavaScript, anda boleh mengakses kandungan seperti yang anda lakukan dengan HTML biasa. Contohnya:
<code class="python">r.html.find('#myElementID').text</code>
Ini akan mengembalikan kandungan elemen HTML dengan ID "myElementID".
Ciri Tambahan:
Permintaan -HTML membalut BeautifulSoup, membolehkan anda melakukan tindakan tambahan seperti:
Dengan menggunakan Permintaan-HTML, anda boleh dengan mudah mendapatkan data daripada tapak web berdaya JavaScript tanpa mengorbankan kesederhanaan dan kuasa Permintaan.
Atas ialah kandungan terperinci Bagaimanakah saya boleh mengikis kandungan daripada tapak web yang sangat bergantung pada JavaScript menggunakan Permintaan dalam Python?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!