Cara Mengikis Web

Linda Hamilton
Lepaskan: 2024-10-17 19:08:02
asal
362 orang telah melayarinya

How to Web Scrape

Mengikis Web dengan PHP

Soalan:

Bagaimana saya boleh mengekstrak tajuk, an imej dan teks atau penerangan daripada URL yang ditentukan tanpa perpustakaan luaran dalam PHP?

Jawapan:

Untuk memudahkan tugas ini, pertimbangkan untuk menggunakan perpustakaan simple_html_dom. Contoh berikut menunjukkan cara untuk mendapatkan tajuk dan imej pertama menggunakan pustaka ini:

<code class="php">require 'simple_html_dom.php';

$html = file_get_html('http://www.google.com/');
$title = $html->find('title', 0);
$image = $html->find('img', 0);

echo $title->plaintext . "<br>\n";
echo $image->src;</code>
Salin selepas log masuk

Jika anda memilih untuk mengelakkan perpustakaan luaran, anda boleh mengekstrak data menggunakan ungkapan biasa, walaupun pendekatan ini tidak disyorkan untuk HTML.

<code class="php">$data = file_get_contents('http://www.google.com/');

preg_match('/<title>([^<]+)<\/title>/i', $data, $matches);
$title = $matches[1];

preg_match('/<img[^>]*src=["\']([^\'"']+)["\'][^>]*>/i', $data, $matches);
$img = $matches[1];

echo $title . "<br>\n";
echo $img;</code>
Salin selepas log masuk

Atas ialah kandungan terperinci Cara Mengikis Web. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

sumber:php
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Artikel terbaru oleh pengarang
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan