Saya ingin mengekstrak kandungan bekas separa berikut:
<section class="tiw-line-name " id="EU-group-holiday-line-0" data-side="both"> <a href="/event=479/darkmoon-faire"><img src="https://wow.zamimg.com/images/wow/icons/tiny/calendar_darkmoonfaireelwynnstart.gif">Darkmoon Faire</a> </section>
Selalunya saya guna XPath macam ni:
$xpath->query('//*[contains(@id, "EU-group-holiday-line")]');
Masalahnya sekarang ialah laman web nampaknya menggunakan javascript untuk menjana kandungan ini. Juga, saya tidak melihat sebarang permintaan XHR, yang akan membantu.
Adakah terdapat peluang untuk mengekstrak data?
Untuk menjadikannya lebih jelas. Ini bukan laman web saya. Saya perlu merebutnya.
Ini adalah halaman penuh:
https://www.wowhead.com/today-in-wow
Anda betul, tapak menggunakan JavaScript sisi pelanggan dan tidak menggunakan permintaan XHR tambahan untuk data di atas. Oleh itu, kami mungkin menjangkakan data berada dalam kod yang dimuatkan pada mulanya (HTML+JS). Mencari kod untuk sesuatu seperti
event=643
(类似于您的event=479
) mengesahkan cadangan kami dan menghasilkan subrentetan berformat JSON yang diperlukan (saya telah menambah lekukan):Jadi, anda akan melihat bahawa data yang diekstrak mengandungi data yang diperlukan dan kami mungkin menggunakan pelbagai alat untuk mengikisnya.