Web Scraping dalam PHP: Pratonton URL Diberi
Objektif anda adalah untuk mengekstrak elemen tertentu daripada halaman web yang disediakan oleh pengguna menggunakan PHP . Dalam kes ini, anda berhasrat untuk mendapatkan semula tajuk halaman, imej logo dan teks atau penerangan ringkas.
Satu pendekatan yang disyorkan ialah menggunakan perpustakaan simple_html_dom, yang memudahkan proses mengikis. Berikut ialah contoh yang berfungsi menggunakan simple_html_dom:
<code class="php">require 'simple_html_dom.php'; $html = file_get_html('http://www.google.com/'); $title = $html->find('title', 0); $image = $html->find('img', 0); echo $title->plaintext."<br>\n"; echo $image->src;</code>
Sebagai alternatif, anda boleh melakukannya tanpa pustaka luaran, walaupun melalui kaedah yang kurang disyorkan untuk menggunakan regex pada HTML:
<code class="php">$data = file_get_contents('http://www.google.com/'); preg_match('/<title>([^<]+)<\/title>/i', $data, $matches); $title = $matches[1]; preg_match('/<img[^>]*src=["\']([^\'"]+)["\'][^>]*>/i', $data, $matches); $img = $matches[1]; echo $title."<br>\n"; echo $img;</code>
Contoh ini menunjukkan cara mengikis dan memaparkan tajuk dan imej halaman web dengan berkesan menggunakan simple_html_dom atau regex. Harap maklum bahawa penggunaan regex pada HTML secara amnya tidak digalakkan, kerana ia boleh membawa kepada hasil yang kurang mantap dan boleh dipercayai.
Atas ialah kandungan terperinci Bagaimana untuk Pratonton URL Diberikan Menggunakan Pengikisan Web dalam PHP?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!