Bagaimana untuk menghuraikan HTML DOM menggunakan PHP dan HTML Mudah DOM Parser

WBOY
Lepaskan: 2023-06-17 11:48:02
asal
1860 orang telah melayarinya

HTML DOM (Document Object Model) ialah cara yang mudah dan intuitif untuk mendapatkan dan memanipulasi elemen, nod dan atribut dalam dokumen HTML. PHP ialah bahasa skrip yang digunakan secara meluas yang boleh digunakan untuk pembangunan aplikasi web. Artikel ini akan memperkenalkan cara menggunakan PHP dan Penghurai DOM HTML Mudah untuk penghuraian DOM HTML.

  1. Pasang dan perkenalkan Simple HTML DOM Parser
    Simple HTML DOM Parser ialah perpustakaan PHP sumber terbuka percuma yang boleh digunakan untuk menghuraikan HTML DOM. Ia boleh dimuat turun dari laman web rasminya dan diperkenalkan ke dalam skrip PHP dengan cara berikut:
require_once 'simple_html_dom.php';
Salin selepas log masuk
  1. Dapatkan kandungan dokumen HTML
    Sebelum melakukan penghuraian DOM HTML, kita perlu mendapatkan kandungannya daripada sumber Dapatkan kandungan dokumen HTML daripada fail. Ini boleh dicapai dalam beberapa cara, salah satunya menggunakan fungsi file_get_contents PHP seperti yang ditunjukkan di bawah:
$html = file_get_contents('example.html');
Salin selepas log masuk

Dalam contoh ini kami menyimpan kandungan dokumen dalam pembolehubah $html untuk kegunaan kemudian.

  1. Menggunakan Penghurai DOM HTML Mudah untuk penghuraian DOM
    Menggunakan Penghurai DOM HTML Mudah, kita boleh membuat instantiate objek DOM HTML dengan:
$html_dom = new simple_html_dom();
Salin selepas log masuk

Seterusnya, kita boleh menggunakan fungsi beban untuk menghantar kandungan dokumen HTML ke objek HTML DOM, seperti yang ditunjukkan di bawah:

$html_dom->load($html);
Salin selepas log masuk

Kini, kita boleh menggunakan pelbagai fungsi dan sifat objek HTML DOM untuk mengakses elemen dalam dokumen HTML.

  1. Dapatkan elemen HTML
    Kita boleh menggunakan fungsi find untuk mendapatkan elemen dalam dokumen HTML, contohnya:
$element = $html_dom->find('.example-class', 0);
Salin selepas log masuk

Dalam contoh ini, kita mendapatkannya dengan nama kelas elemen bernama "example-class".

Kami juga boleh menggunakan pemilih lain seperti ID dan nama teg untuk mendapatkan elemen dalam dokumen HTML. Sebagai contoh, kita boleh mendapatkan elemen dengan ID "example-id" menggunakan kod berikut:

$element = $html_dom->find('#example-id', 0);
Salin selepas log masuk

Begitu juga, kita boleh mendapatkan elemen tag H1 melalui:

$element = $html_dom->find('h1', 0);
Salin selepas log masuk
  1. Dapatkan atribut elemen
    Kita boleh menggunakan fungsi getAttribute untuk mendapatkan atribut elemen HTML, contohnya:
$attr_value = $element->getAttribute('href');
Salin selepas log masuk

Dalam contoh ini, kita mendapat nilai atribut bernama "href".

  1. Dapatkan kandungan teks elemen
    Jika kita ingin mendapatkan kandungan teks elemen HTML, kita boleh menggunakan atribut plaintext seperti berikut:
$element_text = $element->plaintext;
Salin selepas log masuk
  1. Menggelung melalui elemen HTML
    Akhir sekali, kita boleh menggunakan gelung foreach untuk menggelung melalui semua elemen dalam dokumen HTML, seperti yang ditunjukkan di bawah:
foreach ($html_dom->find('a') as $element) {
  $attr_value = $element->getAttribute('href');
  echo $attr_value;
}
Salin selepas log masuk

Dalam contoh ini, kita menggunakan pemilih untuk mencari semua elemen tag dan mengulanginya menggunakan gelung foreach. Semasa gelung, kami mendapat nilai atribut href semua elemen dan mencetaknya.

Kesimpulan
Dengan menggunakan PHP dan Penghurai DOM HTML Mudah, kami boleh melaksanakan penghuraian DOM HTML, mengakses dan memanipulasi elemen dalam dokumen HTML dengan mudah. Harap artikel ini membantu anda!

Atas ialah kandungan terperinci Bagaimana untuk menghuraikan HTML DOM menggunakan PHP dan HTML Mudah DOM Parser. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Label berkaitan:
sumber:php.cn
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan