Rumah pembangunan bahagian belakang tutorial php Mengapa Pengikis Laman Web Saya Mengembalikan Ralat Terlarang 403 dengan `file_get_contents()` pada Pelayan Jauh?

Mengapa Pengikis Laman Web Saya Mengembalikan Ralat Terlarang 403 dengan `file_get_contents()` pada Pelayan Jauh?

Oct 26, 2024 pm 06:04 PM

Why is My Website Scraper Returning a 403 Forbidden Error with `file_get_contents()` on Remote Servers?

403 Forbidden Error with file_get_contents()

Dalam percubaan untuk membangunkan pengikis tapak web, pembangun mengalami ralat 403 Forbidden pada alat kawalan jauh pelayan semasa menggunakan file_get_contents() tanpa sebarang masalah pada mesin tempatan. Mesej ralat menunjukkan bahawa permintaan HTTP gagal.

Setelah diperiksa, tetapan allow_url_fopen dalam fail konfigurasi php.ini telah disahkan untuk didayakan, yang membawa kepada carian untuk penyelesaian selanjutnya. Untuk mendapatkan cerapan tentang punca ralat, mekanisme penyahpepijatan PHP disyorkan.

Secara khusus, pembolehubah $http_response_header boleh memberikan pengepala HTTP respons selepas setiap panggilan file_get_contents(). Selain itu, pilihan konteks ignore_errors boleh mengembalikan respons sebenar, yang berpotensi menjelaskan ralat 403.

Analisis praktikal mencadangkan bahawa ralat mungkin berpunca daripada tiada pengepala HTTP yang diperlukan, seperti Perujuk atau Agen Pengguna. Untuk menangani perkara ini, konteks tersuai boleh dibuat menggunakan stream_context_create() untuk menetapkan User-Agent, mensimulasikan permintaan penyemak imbas sebenar.

$context = stream_context_create(
    array(
        "http" => array(
            "header" => "User-Agent: Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.102 Safari/537.36"
        )
    )
);

echo file_get_contents("www.google.com", false, $context);
Salin selepas log masuk

Contoh kod ini menunjukkan penetapan ejen pengguna dan menghantar permintaan kepada Google , mempamerkan cara memanipulasi pengepala untuk mengikis web yang berkesan.

Atas ialah kandungan terperinci Mengapa Pengikis Laman Web Saya Mengembalikan Ralat Terlarang 403 dengan `file_get_contents()` pada Pelayan Jauh?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Tag artikel panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

11 skrip pemendek URL terbaik PHP (percuma dan premium) 11 skrip pemendek URL terbaik PHP (percuma dan premium) Mar 03, 2025 am 10:49 AM

11 skrip pemendek URL terbaik PHP (percuma dan premium)

Bekerja dengan Data Sesi Flash di Laravel Bekerja dengan Data Sesi Flash di Laravel Mar 12, 2025 pm 05:08 PM

Bekerja dengan Data Sesi Flash di Laravel

Respons HTTP yang dipermudahkan dalam ujian Laravel Respons HTTP yang dipermudahkan dalam ujian Laravel Mar 12, 2025 pm 05:09 PM

Respons HTTP yang dipermudahkan dalam ujian Laravel

Bina aplikasi React dengan hujung belakang Laravel: Bahagian 2, React Bina aplikasi React dengan hujung belakang Laravel: Bahagian 2, React Mar 04, 2025 am 09:33 AM

Bina aplikasi React dengan hujung belakang Laravel: Bahagian 2, React

Pengenalan kepada API Instagram Pengenalan kepada API Instagram Mar 02, 2025 am 09:32 AM

Pengenalan kepada API Instagram

Curl dalam PHP: Cara Menggunakan Pelanjutan PHP Curl dalam API REST Curl dalam PHP: Cara Menggunakan Pelanjutan PHP Curl dalam API REST Mar 14, 2025 am 11:42 AM

Curl dalam PHP: Cara Menggunakan Pelanjutan PHP Curl dalam API REST

12 skrip sembang php terbaik di codecanyon 12 skrip sembang php terbaik di codecanyon Mar 13, 2025 pm 12:08 PM

12 skrip sembang php terbaik di codecanyon

Pemberitahuan di Laravel Pemberitahuan di Laravel Mar 04, 2025 am 09:22 AM

Pemberitahuan di Laravel

See all articles