Rumah pembangunan bahagian belakang masalah PHP Cara membaca kod sumber halaman web yang diubah hala dalam PHP

Cara membaca kod sumber halaman web yang diubah hala dalam PHP

Mar 31, 2023 am 09:05 AM

PHP ialah bahasa skrip bahagian pelayan yang digunakan secara meluas yang membantu pembangun mencipta aplikasi web dinamik. Walau bagaimanapun, kadangkala pembangun PHP perlu membaca kod sumber halaman web luaran, yang mungkin merupakan pautan lompat. Dalam artikel ini, kita akan belajar cara menggunakan PHP untuk membaca kod sumber pautan ubah hala.

Nota: Dalam artikel ini, kami akan menganggap bahawa anda sudah biasa dengan bahasa PHP dan mempunyai pemahaman asas tentang protokol HTML dan HTTP.

Langkah 1: Buka pautan menggunakan cURL

cURL ialah perpustakaan untuk memproses URL dalam PHP. Untuk membaca kod sumber halaman web yang dipautkan, kita perlu menggunakan cURL untuk membuka pautan. Berikut ialah kod asas untuk menggunakan cURL untuk membuka halaman web dalam PHP:

$url = 'http://www.example.com';
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
$output = curl_exec($ch);
curl_close($ch);
Salin selepas log masuk

Dalam kod di atas, kami mula-mula menentukan alamat pautan halaman web untuk dibaca, kemudian buat pemegang cURL dan tetapkan pilihan Terpaut akses, menghantar permintaan cURL dan mendapat respons. Hasilnya disimpan dalam pembolehubah $output.

Langkah 2: Kendalikan pautan lompat

Dalam sesetengah kes, pautan yang kami buka mungkin pautan lompat, yang bermaksud ia akan mengubah hala ke pautan lain. Untuk mendapatkan kod sumber halaman web yang diubah hala, kami perlu menyemak maklumat pengepala respons untuk menentukan sama ada terdapat pengepala Lokasi. Jika ia wujud, ini bermakna ini adalah pautan lompat, dan alamat pautan diubah hala disimpan dalam Lokasi Kami perlu menggunakan cURL untuk membuka pautan diubah hala ini untuk mendapatkan kod sumber.

Berikut ialah contoh kod:

$url = 'http://www.example.com';
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true);
$output = curl_exec($ch);
$info = curl_getinfo($ch);
curl_close($ch);

if ($info['http_code'] == 301 || $info['http_code'] == 302) {
    $url = $info['redirect_url'];
    $ch = curl_init();
    curl_setopt($ch, CURLOPT_URL, $url);
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
    $output = curl_exec($ch);
    curl_close($ch);
}
Salin selepas log masuk

Dalam kod di atas, kami telah menambah pilihan curl_setopt: CURLOPT_FOLLOWLOCATION. Pilihan ini memberitahu cURL untuk mengikuti mesej ubah hala dan membuka pautan baharu secara automatik. Kemudian, kami memperoleh maklumat pengepala respons dan menentukan sama ada terdapat maklumat ubah hala. Jika ia wujud, kami menggunakan fungsi curl_init() untuk mencipta pemegang cURL baharu, buka pautan ubah hala dan dapatkan kod sumber.

Langkah 3: Menghuraikan kod sumber

Selepas mendapatkan kod sumber halaman web, kami perlu menghuraikannya dengan lebih lanjut supaya kami boleh memproses data. Kita boleh menggunakan kelas DOMDocument terbina dalam PHP untuk menghuraikan dokumen HTML.

Berikut ialah contoh kod:

$url = 'http://www.example.com';
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true);
$output = curl_exec($ch);
$info = curl_getinfo($ch);
curl_close($ch);

if ($info['http_code'] == 301 || $info['http_code'] == 302) {
    $url = $info['redirect_url'];
    $ch = curl_init();
    curl_setopt($ch, CURLOPT_URL, $url);
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
    $output = curl_exec($ch);
    curl_close($ch);
}

$doc = new DOMDocument();
@$doc->loadHTML($output);
$elements = $doc->getElementsByTagName('html');
$title = $doc->getElementsByTagName('title')->item(0)->nodeValue;
Salin selepas log masuk

Dalam kod di atas, kami mula-mula mencipta objek DOMDocument, dan kemudian memanggil fungsi loadHTML() untuk menghantar sumber halaman web yang diperolehi kod sebagai parameter. Seterusnya, kami menggunakan fungsi getElementsByTagName() untuk mendapatkan elemen yang ditentukan dan atribut nodeValue untuk mendapatkan kandungan teks elemen tersebut. Dalam contoh ini, kita mendapat elemen HTML dan elemen tajuk.

Langkah 4: Proses data

Akhir sekali, kami boleh memproses data yang diperolehi dan menyimpan atau memaparkannya mengikut keperluan. Berikut ialah contoh mudah:

$url = 'http://www.example.com';
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true);
$output = curl_exec($ch);
$info = curl_getinfo($ch);
curl_close($ch);

if ($info['http_code'] == 301 || $info['http_code'] == 302) {
    $url = $info['redirect_url'];
    $ch = curl_init();
    curl_setopt($ch, CURLOPT_URL, $url);
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
    $output = curl_exec($ch);
    curl_close($ch);
}

$doc = new DOMDocument();
@$doc->loadHTML($output);
$title = $doc->getElementsByTagName('title')->item(0)->nodeValue;
echo "源码标题是:" . $title . "\n";
echo "HTML源码是:" . $output;
Salin selepas log masuk

Dalam kod di atas, kita mula-mula mendapat tajuk halaman web, dan kemudian terus mengeluarkan kod sumber HTML.

Kesimpulan

Dalam artikel ini, kami mempelajari cara menggunakan PHP untuk membaca kod sumber halaman web yang diubah hala. Dengan menggunakan cURL untuk membuka pautan, memproses pautan lompat, menghuraikan dokumen HTML dan memproses data, kami boleh membaca kod sumber halaman web pautan lompat dengan mudah. Ini adalah kemahiran yang sangat berguna apabila anda perlu menggunakan perangkak web, analisis data, perlombongan data dan senario lain.

Atas ialah kandungan terperinci Cara membaca kod sumber halaman web yang diubah hala dalam PHP. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

OWASP Top 10 PHP: Huraikan dan mengurangkan kelemahan umum. OWASP Top 10 PHP: Huraikan dan mengurangkan kelemahan umum. Mar 26, 2025 pm 04:13 PM

Artikel ini membincangkan kelemahan OWASP 10 dalam strategi PHP dan mitigasi. Isu -isu utama termasuk suntikan, pengesahan yang rosak, dan XSS, dengan alat yang disyorkan untuk memantau dan mendapatkan aplikasi PHP.

PHP 8 JIT (Just-in-Time) Penyusunan: Bagaimana ia meningkatkan prestasi. PHP 8 JIT (Just-in-Time) Penyusunan: Bagaimana ia meningkatkan prestasi. Mar 25, 2025 am 10:37 AM

Kompilasi JIT Php 8 meningkatkan prestasi dengan menyusun kod yang sering dilaksanakan ke dalam kod mesin, memberi manfaat kepada aplikasi dengan pengiraan berat dan mengurangkan masa pelaksanaan.

PHP Secure File Muat naik: Mencegah kelemahan berkaitan fail. PHP Secure File Muat naik: Mencegah kelemahan berkaitan fail. Mar 26, 2025 pm 04:18 PM

Artikel ini membincangkan mendapatkan muat naik fail PHP untuk mengelakkan kelemahan seperti suntikan kod. Ia memberi tumpuan kepada pengesahan jenis fail, penyimpanan selamat, dan pengendalian ralat untuk meningkatkan keselamatan aplikasi.

Penyulitan PHP: Penyulitan simetri vs asimetrik. Penyulitan PHP: Penyulitan simetri vs asimetrik. Mar 25, 2025 pm 03:12 PM

Artikel ini membincangkan penyulitan simetri dan asimetrik dalam PHP, membandingkan kesesuaian, prestasi, dan perbezaan keselamatan mereka. Penyulitan simetri lebih cepat dan sesuai untuk data pukal, manakala asimetrik digunakan untuk pertukaran utama yang selamat.

Pengesahan PHP & amp; Kebenaran: Pelaksanaan selamat. Pengesahan PHP & amp; Kebenaran: Pelaksanaan selamat. Mar 25, 2025 pm 03:06 PM

Artikel ini membincangkan pelaksanaan pengesahan dan kebenaran yang mantap dalam PHP untuk mencegah akses yang tidak dibenarkan, memperincikan amalan terbaik dan mengesyorkan alat peningkatan keselamatan.

PHP CSRF Perlindungan: Bagaimana untuk mencegah serangan CSRF. PHP CSRF Perlindungan: Bagaimana untuk mencegah serangan CSRF. Mar 25, 2025 pm 03:05 PM

Artikel ini membincangkan strategi untuk mencegah serangan CSRF di PHP, termasuk menggunakan token CSRF, kuki tapak yang sama, dan pengurusan sesi yang betul.

PHP API Kadar Mengehadkan: Strategi Pelaksanaan. PHP API Kadar Mengehadkan: Strategi Pelaksanaan. Mar 26, 2025 pm 04:16 PM

Artikel ini membincangkan strategi untuk melaksanakan kadar API yang mengehadkan PHP, termasuk algoritma seperti baldi token dan baldi bocor, dan menggunakan perpustakaan seperti simfoni/kadar-limiter. Ia juga meliputi pemantauan, had kadar penyesuaian secara dinamik, dan tangan

Pengesahan Input PHP: Amalan Terbaik. Pengesahan Input PHP: Amalan Terbaik. Mar 26, 2025 pm 04:17 PM

Artikel membincangkan amalan terbaik untuk pengesahan input PHP untuk meningkatkan keselamatan, memberi tumpuan kepada teknik seperti menggunakan fungsi terbina dalam, pendekatan putih, dan pengesahan sisi pelayan.

See all articles