Bagaimana untuk Memintas Sekatan Laman Web dengan Permintaan Python dan Ejen Pengguna Palsu?

DDD
Lepaskan: 2024-11-13 10:35:02
asal
722 orang telah melayarinya

How to Bypass Website Blocks with Python's Requests and Fake User Agents?

Cara Mensimulasikan Gelagat Penyemak Imbas dengan Permintaan Python dan Ejen Pengguna Palsu

Pustaka Permintaan Python ialah alat yang berkuasa untuk membuat permintaan HTTP, tetapi ia mungkin menghadapi batasan apabila cuba mengakses tapak web tertentu. Ini kerana tapak web boleh melaksanakan langkah anti-bot yang membezakan antara penyemak imbas sebenar dan skrip automatik. Untuk memintas sekatan ini, pembangun boleh menggunakan teknik untuk meniru gelagat penyemak imbas dan menjana pengepala Ejen Pengguna tersuai.

Menyediakan Pengepala Ejen Pengguna

Satu kaedah yang berkesan ialah menyediakan pengepala Ejen Pengguna yang sah, yang mengenal pasti penyemak imbas dan sistem pengendalian yang digunakan oleh peminta. Dengan meniru penyemak imbas popular seperti Chrome atau Firefox, Permintaan boleh meningkatkan peluang untuk mendapatkan respons yang diingini daripada tapak web sasaran.

import requests

url = 'http://www.ichangtou.com/#company:data_000008.html'
headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.95 Safari/537.36'}

response = requests.get(url, headers=headers)
print(response.content)
Salin selepas log masuk

Menggunakan Perpustakaan Fake-useragent

Untuk pendekatan yang lebih mudah, perpustakaan ejen pengguna palsu menyediakan pangkalan data rentetan Ejen Pengguna yang teguh. Dengan menggunakan perpustakaan ini, pembangun boleh menjana Ejen Pengguna yang realistik dengan mudah.

from fake_useragent import UserAgent

ua = UserAgent()
headers = {'User-Agent': ua.chrome}

response = requests.get(url, headers=headers)
Salin selepas log masuk

Dengan memalsukan lawatan penyemak imbas dan menjana pengepala Ejen Pengguna yang sesuai, Permintaan Python boleh memintas sekatan tapak web dan mendapatkan maklumat seolah-olah ia datang daripada pelayar tulen. Teknik ini membuka kemungkinan baharu untuk mengautomasikan tugasan web, mengakses kandungan terhad dan mempertingkatkan ketepatan operasi mengikis web.

Atas ialah kandungan terperinci Bagaimana untuk Memintas Sekatan Laman Web dengan Permintaan Python dan Ejen Pengguna Palsu?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

sumber:php.cn
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan