Pernyataan Masalah:
Untuk mencipta halaman yang menyenaraikan semua imej daripada laman web, bersama dengan tajuk dan perwakilan alternatifnya, kaedah untuk mengekstrak atribut ini daripada HTML diperlukan. Susunan atribut mungkin berbeza-beza, dan mendapatkan kesemuanya menimbulkan cabaran.
Mengekstrak Data menggunakan Ungkapan Biasa:
Pada mulanya, masalah boleh didekati menggunakan biasa ungkapan. Walau bagaimanapun, disebabkan susunan atribut yang berbeza-beza, kaedah ini tidak dianggap elegan dan boleh mengakibatkan proses penghuraian char-by-char yang menyusahkan.
DOMDocument Solution:
Pendekatan alternatif ialah menggunakan kelas PHP DOMDocument. Kelas ini membolehkan penghuraian HTML dan akses kepada elemennya. Berikut ialah kod untuk mencapai ini:
$url = "http://example.com"; $html = file_get_contents($url); $doc = new DOMDocument(); @$doc->loadHTML($html); $tags = $doc->getElementsByTagName('img'); foreach ($tags as $tag) { echo $tag->getAttribute('src').', '; echo $tag->getAttribute('title').', '; echo $tag->getAttribute('alt').'<br>'; }
Penjelasan:
Kod ini memulakan objek DOMDocument dan memuatkan HTML ke dalamnya. Kaedah getElementsByTagName digunakan untuk mendapatkan semula semua imej. Setiap teg img kemudiannya diulang, dan kaedah getAttribute digunakan untuk mengekstrak atribut src, tajuk dan alt. Data yang diekstrak digemakan, menghasilkan output maklumat imej yang diformatkan.
Atas ialah kandungan terperinci Bagaimanakah Saya Boleh Mengekstrak Data Imej (src, tajuk, alt) dengan Cekap daripada HTML Menggunakan PHP?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!