Ekstrak kandungan yang dihasilkan javascript untuk halaman tertentu
P粉536909186
P粉536909186 2023-09-10 19:14:34
0
1
509

Saya ingin mengekstrak kandungan bekas separa berikut:

<section class="tiw-line-name " id="EU-group-holiday-line-0" data-side="both">
<a href="/event=479/darkmoon-faire"><img src="https://wow.zamimg.com/images/wow/icons/tiny/calendar_darkmoonfaireelwynnstart.gif">Darkmoon Faire</a>
</section>

Selalunya saya guna XPath macam ni:

$xpath->query('//*[contains(@id, "EU-group-holiday-line")]');

Masalahnya sekarang ialah laman web nampaknya menggunakan javascript untuk menjana kandungan ini. Juga, saya tidak melihat sebarang permintaan XHR, yang akan membantu.

Adakah terdapat peluang untuk mengekstrak data?

Untuk menjadikannya lebih jelas. Ini bukan laman web saya. Saya perlu merebutnya.

Ini adalah halaman penuh:

https://www.wowhead.com/today-in-wow

P粉536909186
P粉536909186

membalas semua(1)
P粉041758700

Anda betul, tapak menggunakan JavaScript sisi pelanggan dan tidak menggunakan permintaan XHR tambahan untuk data di atas. Oleh itu, kami mungkin menjangkakan data berada dalam kod yang dimuatkan pada mulanya (HTML+JS). Mencari kod untuk sesuatu seperti event=643(类似于您的 event=479) mengesahkan cadangan kami dan menghasilkan subrentetan berformat JSON yang diperlukan (saya telah menambah lekukan):

{
   "icon": "calendar_weekendmistsofpandariastart",
   "name": "Timewalking Dungeon Event",
   "side": "both",
   "url": "/event=643/timewalking-dungeon-event"
},

Jadi, anda akan melihat bahawa data yang diekstrak mengandungi data yang diperlukan dan kami mungkin menggunakan pelbagai alat untuk mengikisnya.

Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan