Menghuraikan HTML dengan HTML DOMDocument PHP
Soalan:
Menggunakan objek DOMDocument, tangkap teks dalam elemen HTML tertentu. Contohnya, mengekstrak "Tangkap teks ini 1" dan "Tangkap teks ini 2" daripada HTML berikut:
<div class="main"> <div class="text"> Capture this text 1 </div> </div> <div class="main"> <div class="text"> Capture this text 2 </div> </div>
Jawapan:
Menggunakan DOMDocument::getElementsByTagName untuk mendapatkan semula semua tag dengan nama tertentu mungkin terbukti tidak cekap untuk tugas ini. Sebaliknya, pertimbangkan untuk menggunakan pertanyaan XPath pada dokumen, memanfaatkan kelas DOMXPath.
Pelaksanaan:
Muat HTML ke dalam DOMDocument Objek:
<code class="php">$html = <<<HTML <div class="main"> <div class="text"> Capture this text 1 </div> </div> <div class="main"> <div class="text"> Capture this text 2 </div> </div> HTML; $dom = new DOMDocument(); $dom->loadHTML($html);</code>
Segera Objek DOMXPath:
<code class="php">$xpath = new DOMXPath($dom);</code>
Laksanakan XPath Pertanyaan:
<code class="php">$tags = $xpath->query('//div[@class="main"]/div[@class="text"]');</code>
Dapatkan Nilai Teks:
<code class="php">foreach ($tags as $tag) { var_dump(trim($tag->nodeValue)); }</code>
Pendekatan ini berkesan mengekstrak " Tangkap teks ini 1" dan "Tangkap teks ini 2" daripada HTML yang disediakan.
Atas ialah kandungan terperinci Bagaimana untuk Mengekstrak Teks dengan Cekap daripada Elemen HTML Tertentu Menggunakan DOMDocument dan XPath PHP?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!