Rumah Perpustakaan PHP Perpustakaan lain perpustakaan merangkak laman web php
php laman web merangkak perpustakaan
<?php
header("Content-Type: text/html; charset=UTF-8");
require("phpQuery.php");
$hj = QueryList::Query('http://mobile.csdn.net/',array("title"=>array('.unit h1','text')));
//dump($hj->data);
$data = QueryList::Query('http://cms.querylist.cc/bizhi/453.html',array(
    'image' => array('img','src')
    ))->data;
//
$data = QueryList::Query('http://cms.querylist.cc/google/list_1.html',array(
    'link' => array('a','href')
    ))->data;
$page = 'http://cms.querylist.cc/news/566.html';
$reg = array(
    'title' => array('h1','text'),
    'date' => array('.pt_info','text','-span -a',function($content){
        $arr = explode(' ',$content);
        return $arr[0];
    }),
    'content' => array('.post_content','html','a -.content_copyright -script',function($content){
     
            $doc = phpQuery::newDocumentHTML($content);
            $imgs = pq($doc)->find('img');
            foreach ($imgs as $img) {
                $src = 'http://cms.querylist.cc'.pq($img)->attr('src');
                $localSrc = 'w/'.md5($src).'.jpg';
                $stream = file_get_contents($src);
                file_put_contents($localSrc,$stream);
                pq($img)->attr('src',$localSrc);
            }
            return $doc->htmlOuter();
    })
    );
$rang = '.content';
$ql = QueryList::Query($page,$reg,$rang);
$data = $ql->getData();
dump($data);

menyokong tapak web merangkak dan merangkak Ia adalah projek sumber terbuka sebelah pelayan berdasarkan PHP. Ia membolehkan pembangun PHP memproses kandungan dokumen DOM dengan mudah, seperti mendapatkan maklumat tajuk laman web. Apa yang lebih menarik ialah ia menggunakan idea jQuery Anda boleh memproses kandungan halaman sama seperti menggunakan jQuery untuk mendapatkan maklumat halaman yang anda inginkan.

Penafian

Semua sumber di laman web ini disumbangkan oleh netizen atau dicetak semula oleh tapak muat turun utama. Sila semak integriti perisian itu sendiri! Semua sumber di laman web ini adalah untuk rujukan pembelajaran sahaja. Tolong jangan gunakannya untuk tujuan komersial. Jika tidak, anda akan bertanggungjawab untuk semua akibat! Jika terdapat sebarang pelanggaran, sila hubungi kami untuk memadamkannya. Maklumat hubungan: admin@php.cn

Artikel Berkaitan

Tutorial Asas Merangkak Web PHP: Menggunakan Perpustakaan cURL untuk Mengakses Laman Web Tutorial Asas Merangkak Web PHP: Menggunakan Perpustakaan cURL untuk Mengakses Laman Web

13 Jun 2023

Dengan perkembangan Internet dan peningkatan jumlah data, perangkak web telah menjadi salah satu cara penting untuk mendapatkan maklumat Internet. Perangkak web ialah program automatik yang mengakses tapak web melalui permintaan rangkaian, merangkak maklumat di tapak web, memproses dan menganalisisnya. Dalam kes ini, kami akan memperkenalkan cara menulis perangkak web asas dalam PHP, menggunakan perpustakaan cURL untuk mengakses tapak web yang perlu dirangkak dan memproses maklumat yang diperolehi. Pemasangan pustaka cURL Pustaka cURL ialah alat yang sangat berkuasa untuk bekerja dengan URL daripada baris arahan

Buat laman web perpustakaan menggunakan rangka kerja Yii Buat laman web perpustakaan menggunakan rangka kerja Yii

21 Jun 2023

Dengan kemunculan era digital, perpustakaan secara beransur-ansur merealisasikan transformasi digital mereka sendiri, secara beransur-ansur beralih daripada pengurusan berasaskan kertas tradisional kepada pengurusan digital. Dalam proses pengurusan digital, menggunakan aplikasi laman web untuk mengurus perpustakaan telah menjadi cara yang sangat popular, kerana ia dapat membantu perpustakaan mengurus buku, rekod peminjaman, akaun pengguna dan maklumat lain dengan lebih baik. Menggunakan rangka kerja Yii untuk mencipta laman web perpustakaan telah menjadi cara yang sangat mudah dan berkesan. Artikel ini akan memperkenalkan cara menggunakan rangka kerja Yii untuk mencipta tapak web perpustakaan. Y

Perangkak PHP menggunakan perpustakaan cURL untuk merangkak halaman web Perangkak PHP menggunakan perpustakaan cURL untuk merangkak halaman web

13 Jun 2023

Dengan perkembangan pesat Internet, pemerolehan dan pemprosesan data rangkaian telah menjadi salah satu keperluan biasa dalam semua lapisan masyarakat. Antaranya, teknologi perangkak akan digunakan untuk mengumpul dan memproses sejumlah besar data secara automatik. Dalam pembinaan teknologi crawler, menggunakan perpustakaan cURL boleh meningkatkan kecekapan dan kestabilan crawler. Artikel ini akan memperkenalkan cara menggunakan perpustakaan cURL untuk melaksanakan halaman web perangkak mudah. 1. Pengenalan kepada perpustakaan cURL cURL ialah alat penghantaran data yang fungsi utamanya adalah untuk menghantar data melalui alamat URL. Pustaka cURL bukan sahaja menyokong pelbagai

Bagaimana untuk menggunakan perpustakaan kelas PHP Goutte untuk merangkak web dan pengekstrakan data? Bagaimana untuk menggunakan perpustakaan kelas PHP Goutte untuk merangkak web dan pengekstrakan data?

09 Aug 2023

Bagaimana untuk menggunakan perpustakaan kelas PHPGoutte untuk merangkak web dan pengekstrakan data? Gambaran Keseluruhan: Dalam proses pembangunan harian, kita selalunya perlu mendapatkan pelbagai data daripada Internet, seperti kedudukan filem, ramalan cuaca, dsb. Merangkak web adalah salah satu kaedah biasa untuk mendapatkan data ini. Dalam pembangunan PHP, kita boleh menggunakan perpustakaan kelas Goutte untuk melaksanakan rangkak web dan fungsi pengekstrakan data. Artikel ini akan memperkenalkan cara menggunakan perpustakaan kelas PHPGoutte untuk merangkak halaman web dan mengekstrak data serta melampirkan contoh kod. Apa itu Gout

Temui khazanah laman web rasmi perpustakaan pemodelan bahasa Go Temui khazanah laman web rasmi perpustakaan pemodelan bahasa Go

01 Mar 2024

Bahasa Go ialah bahasa pengaturcaraan popular yang digunakan secara meluas dalam pelbagai bidang seperti pembangunan web, pengkomputeran awan dan kecerdasan buatan. Berbanding dengan bahasa pengaturcaraan lain, bahasa Go mempunyai kecekapan pelaksanaan yang lebih tinggi, sintaks yang lebih mudah dan keupayaan pemprosesan serentak yang lebih berkuasa, jadi ia sangat popular di kalangan pengaturcara. Dalam ekosistem bahasa Go, pelbagai perpustakaan pemodelan sumber terbuka yang sangat baik juga telah muncul, menyediakan pembangun dengan banyak sumber dan alatan. Artikel ini akan memperkenalkan beberapa tapak web harta karun yang menemui pustaka pemodelan bahasa Go untuk membantu pembaca memahami dan menggunakan yang berkuasa ini dengan lebih baik.

Laman web rasmi perpustakaan pemodelan bahasa Go mendedahkan rahsia Laman web rasmi perpustakaan pemodelan bahasa Go mendedahkan rahsia

01 Mar 2024

Dalam perkembangan pesat bahasa Go sejak beberapa tahun kebelakangan ini, sebagai bahasa pengaturcaraan yang pantas dan cekap, ia telah menarik lebih ramai pembangun dan syarikat untuk memilih untuk menggunakannya. Dalam ekosistem bahasa Go, perpustakaan pemodelan merupakan bahagian yang sangat penting Mereka menyediakan fungsi dan alatan yang kaya untuk membantu pembangun membina aplikasi yang kompleks dengan cepat. Antaranya, laman web rasmi perpustakaan model telah menarik perhatian ramai dan dianggap sebagai peneraju dalam bidang perpustakaan model bahasa Go. Hari ini, kami akan mendedahkan ciri-ciri indah laman web rasmi ini. Laman web rasmi perpustakaan model ini terkenal dengan gaya reka bentuk yang ringkas dan intuitif.

See all articles