Mengikis Web dengan PHP
Soalan:
Bagaimana saya boleh mengekstrak tajuk, an imej dan teks atau penerangan daripada URL yang ditentukan tanpa perpustakaan luaran dalam PHP?
Jawapan:
Untuk memudahkan tugas ini, pertimbangkan untuk menggunakan perpustakaan simple_html_dom. Contoh berikut menunjukkan cara untuk mendapatkan tajuk dan imej pertama menggunakan pustaka ini:
<code class="php">require 'simple_html_dom.php'; $html = file_get_html('http://www.google.com/'); $title = $html->find('title', 0); $image = $html->find('img', 0); echo $title->plaintext . "<br>\n"; echo $image->src;</code>
Jika anda memilih untuk mengelakkan perpustakaan luaran, anda boleh mengekstrak data menggunakan ungkapan biasa, walaupun pendekatan ini tidak disyorkan untuk HTML.
<code class="php">$data = file_get_contents('http://www.google.com/'); preg_match('/<title>([^<]+)<\/title>/i', $data, $matches); $title = $matches[1]; preg_match('/<img[^>]*src=["\']([^\'"']+)["\'][^>]*>/i', $data, $matches); $img = $matches[1]; echo $title . "<br>\n"; echo $img;</code>
Atas ialah kandungan terperinci Cara Mengikis Web. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!