<?php header("Content-Type: text/html; charset=UTF-8"); require("phpQuery.php"); $hj = QueryList::Query('http://mobile.csdn.net/',array("title"=>array('.unit h1','text'))); //dump($hj->data); $data = QueryList::Query('http://cms.querylist.cc/bizhi/453.html',array( 'image' => array('img','src') ))->data; // $data = QueryList::Query('http://cms.querylist.cc/google/list_1.html',array( 'link' => array('a','href') ))->data; $page = 'http://cms.querylist.cc/news/566.html'; $reg = array( 'title' => array('h1','text'), 'date' => array('.pt_info','text','-span -a',function($content){ $arr = explode(' ',$content); return $arr[0]; }), 'content' => array('.post_content','html','a -.content_copyright -script',function($content){ $doc = phpQuery::newDocumentHTML($content); $imgs = pq($doc)->find('img'); foreach ($imgs as $img) { $src = 'http://cms.querylist.cc'.pq($img)->attr('src'); $localSrc = 'w/'.md5($src).'.jpg'; $stream = file_get_contents($src); file_put_contents($localSrc,$stream); pq($img)->attr('src',$localSrc); } return $doc->htmlOuter(); }) ); $rang = '.content'; $ql = QueryList::Query($page,$reg,$rang); $data = $ql->getData(); dump($data);
menyokong tapak web merangkak dan merangkak Ia adalah projek sumber terbuka sebelah pelayan berdasarkan PHP. Ia membolehkan pembangun PHP memproses kandungan dokumen DOM dengan mudah, seperti mendapatkan maklumat tajuk laman web. Apa yang lebih menarik ialah ia menggunakan idea jQuery Anda boleh memproses kandungan halaman sama seperti menggunakan jQuery untuk mendapatkan maklumat halaman yang anda inginkan.
Semua sumber di laman web ini disumbangkan oleh netizen atau dicetak semula oleh tapak muat turun utama. Sila semak integriti perisian itu sendiri! Semua sumber di laman web ini adalah untuk rujukan pembelajaran sahaja. Tolong jangan gunakannya untuk tujuan komersial. Jika tidak, anda akan bertanggungjawab untuk semua akibat! Jika terdapat sebarang pelanggaran, sila hubungi kami untuk memadamkannya. Maklumat hubungan: admin@php.cn
Artikel Berkaitan
13 Jun 2023
Dengan perkembangan Internet dan peningkatan jumlah data, perangkak web telah menjadi salah satu cara penting untuk mendapatkan maklumat Internet. Perangkak web ialah program automatik yang mengakses tapak web melalui permintaan rangkaian, merangkak maklumat di tapak web, memproses dan menganalisisnya. Dalam kes ini, kami akan memperkenalkan cara menulis perangkak web asas dalam PHP, menggunakan perpustakaan cURL untuk mengakses tapak web yang perlu dirangkak dan memproses maklumat yang diperolehi. Pemasangan pustaka cURL Pustaka cURL ialah alat yang sangat berkuasa untuk bekerja dengan URL daripada baris arahan
21 Jun 2023
Dengan kemunculan era digital, perpustakaan secara beransur-ansur merealisasikan transformasi digital mereka sendiri, secara beransur-ansur beralih daripada pengurusan berasaskan kertas tradisional kepada pengurusan digital. Dalam proses pengurusan digital, menggunakan aplikasi laman web untuk mengurus perpustakaan telah menjadi cara yang sangat popular, kerana ia dapat membantu perpustakaan mengurus buku, rekod peminjaman, akaun pengguna dan maklumat lain dengan lebih baik. Menggunakan rangka kerja Yii untuk mencipta laman web perpustakaan telah menjadi cara yang sangat mudah dan berkesan. Artikel ini akan memperkenalkan cara menggunakan rangka kerja Yii untuk mencipta tapak web perpustakaan. Y
13 Jun 2023
Dengan perkembangan pesat Internet, pemerolehan dan pemprosesan data rangkaian telah menjadi salah satu keperluan biasa dalam semua lapisan masyarakat. Antaranya, teknologi perangkak akan digunakan untuk mengumpul dan memproses sejumlah besar data secara automatik. Dalam pembinaan teknologi crawler, menggunakan perpustakaan cURL boleh meningkatkan kecekapan dan kestabilan crawler. Artikel ini akan memperkenalkan cara menggunakan perpustakaan cURL untuk melaksanakan halaman web perangkak mudah. 1. Pengenalan kepada perpustakaan cURL cURL ialah alat penghantaran data yang fungsi utamanya adalah untuk menghantar data melalui alamat URL. Pustaka cURL bukan sahaja menyokong pelbagai
09 Aug 2023
Bagaimana untuk menggunakan perpustakaan kelas PHPGoutte untuk merangkak web dan pengekstrakan data? Gambaran Keseluruhan: Dalam proses pembangunan harian, kita selalunya perlu mendapatkan pelbagai data daripada Internet, seperti kedudukan filem, ramalan cuaca, dsb. Merangkak web adalah salah satu kaedah biasa untuk mendapatkan data ini. Dalam pembangunan PHP, kita boleh menggunakan perpustakaan kelas Goutte untuk melaksanakan rangkak web dan fungsi pengekstrakan data. Artikel ini akan memperkenalkan cara menggunakan perpustakaan kelas PHPGoutte untuk merangkak halaman web dan mengekstrak data serta melampirkan contoh kod. Apa itu Gout
01 Mar 2024
Bahasa Go ialah bahasa pengaturcaraan popular yang digunakan secara meluas dalam pelbagai bidang seperti pembangunan web, pengkomputeran awan dan kecerdasan buatan. Berbanding dengan bahasa pengaturcaraan lain, bahasa Go mempunyai kecekapan pelaksanaan yang lebih tinggi, sintaks yang lebih mudah dan keupayaan pemprosesan serentak yang lebih berkuasa, jadi ia sangat popular di kalangan pengaturcara. Dalam ekosistem bahasa Go, pelbagai perpustakaan pemodelan sumber terbuka yang sangat baik juga telah muncul, menyediakan pembangun dengan banyak sumber dan alatan. Artikel ini akan memperkenalkan beberapa tapak web harta karun yang menemui pustaka pemodelan bahasa Go untuk membantu pembaca memahami dan menggunakan yang berkuasa ini dengan lebih baik.
01 Mar 2024
Dalam perkembangan pesat bahasa Go sejak beberapa tahun kebelakangan ini, sebagai bahasa pengaturcaraan yang pantas dan cekap, ia telah menarik lebih ramai pembangun dan syarikat untuk memilih untuk menggunakannya. Dalam ekosistem bahasa Go, perpustakaan pemodelan merupakan bahagian yang sangat penting Mereka menyediakan fungsi dan alatan yang kaya untuk membantu pembangun membina aplikasi yang kompleks dengan cepat. Antaranya, laman web rasmi perpustakaan model telah menarik perhatian ramai dan dianggap sebagai peneraju dalam bidang perpustakaan model bahasa Go. Hari ini, kami akan mendedahkan ciri-ciri indah laman web rasmi ini. Laman web rasmi perpustakaan model ini terkenal dengan gaya reka bentuk yang ringkas dan intuitif.
Hot Tools
Pustaka PHP untuk bekas suntikan kebergantungan
Pustaka PHP untuk bekas suntikan kebergantungan
Koleksi 50 algoritma PHP klasik yang sangat baik
Algoritma PHP klasik, pelajari idea yang sangat baik dan kembangkan pemikiran anda
Pustaka PHP kecil untuk mengoptimumkan imej
Pustaka PHP kecil untuk mengoptimumkan imej