Maison Bibliothèques PHP Autres bibliothèques bibliothèque d'exploration de sites Web php
bibliothèque d'exploration de sites Web php
<?php
header("Content-Type: text/html; charset=UTF-8");
require("phpQuery.php");
$hj = QueryList::Query('http://mobile.csdn.net/',array("title"=>array('.unit h1','text')));
//dump($hj->data);
$data = QueryList::Query('http://cms.querylist.cc/bizhi/453.html',array(
    'image' => array('img','src')
    ))->data;
//
$data = QueryList::Query('http://cms.querylist.cc/google/list_1.html',array(
    'link' => array('a','href')
    ))->data;
$page = 'http://cms.querylist.cc/news/566.html';
$reg = array(
    'title' => array('h1','text'),
    'date' => array('.pt_info','text','-span -a',function($content){
        $arr = explode(' ',$content);
        return $arr[0];
    }),
    'content' => array('.post_content','html','a -.content_copyright -script',function($content){
     
            $doc = phpQuery::newDocumentHTML($content);
            $imgs = pq($doc)->find('img');
            foreach ($imgs as $img) {
                $src = 'http://cms.querylist.cc'.pq($img)->attr('src');
                $localSrc = 'w/'.md5($src).'.jpg';
                $stream = file_get_contents($src);
                file_put_contents($localSrc,$stream);
                pq($img)->attr('src',$localSrc);
            }
            return $doc->htmlOuter();
    })
    );
$rang = '.content';
$ql = QueryList::Query($page,$reg,$rang);
$data = $ql->getData();
dump($data);

prend en charge l'exploration de sites Web et l'exploration. Il est très puissant. Il s'agit d'un projet open source côté serveur basé sur PHP. Il permet aux développeurs PHP de traiter facilement le contenu d'un document DOM, par exemple pour obtenir les informations principales d'un site Web d'actualités. Ce qui est plus intéressant, c'est qu'il utilise l'idée de​​jQuery. Vous pouvez traiter le contenu de la page comme si vous utilisiez jQuery pour obtenir les informations de page souhaitées.

Clause de non-responsabilité

Toutes les ressources de ce site proviennent d'internautes ou sont réimprimées par les principaux sites de téléchargement. Veuillez vérifier vous-même l'intégrité du logiciel ! Toutes les ressources de ce site sont uniquement à titre de référence d'apprentissage. Merci de ne pas les utiliser à des fins commerciales. Sinon, vous serez responsable de toutes les conséquences ! En cas d'infraction, veuillez nous contacter pour la supprimer. Coordonnées : admin@php.cn

Article connexe

PHP en pratique : développement efficace d'un programme de robots d'exploration de sites Web PHP en pratique : développement efficace d'un programme de robots d'exploration de sites Web

13 Jun 2023

Un programme de robot d'exploration Web fait référence à un programme qui obtient et analyse automatiquement des informations sur Internet. C'est également l'un des outils importants pour la collecte de données et le traitement de l'information. À l’ère d’Internet, les données constituent un atout extrêmement précieux, et pouvoir obtenir rapidement et précisément des informations sur des sites Web cibles est très important tant pour les entreprises que pour les particuliers. L’utilisation de robots d’exploration Web peut atteindre cet objectif plus efficacement. En tant que langage de programmation efficace, les excellentes fonctionnalités de programmation réseau de PHP et ses riches bibliothèques open source en font un langage très approprié pour développer des programmes de robots d'exploration Web. Livre

Parlons de la façon d'utiliser des bibliothèques open source tierces pour implémenter la fonction d'exploration de sites Web dans Node. Parlons de la façon d'utiliser des bibliothèques open source tierces pour implémenter la fonction d'exploration de sites Web dans Node.

17 Dec 2021

Cet article vous présentera comment implémenter facilement la fonction d'exploration de sites Web dans Node à l'aide de bibliothèques open source tierces. J'espère que cela vous sera utile !

Un partage pratique des robots d'exploration de sites Web Un partage pratique des robots d'exploration de sites Web

27 Jul 2017

Les détails sont les suivants : import requestimport reurl = 'http://www.cnblogs.com/xxxx'def get_html(url): #Ouvrez l'url et obtenez toutes les informations html de l'url html_content = requ

Plongez plus profondément : alternatives de création de sites Web à PHP Plongez plus profondément : alternatives de création de sites Web à PHP

21 Mar 2024

À l’ère d’Internet d’aujourd’hui, la création de sites Web est devenue l’une des compétences indispensables pour de nombreuses personnes. En tant que langage de programmation back-end largement utilisé, PHP est connu et utilisé par de nombreux développeurs. Cependant, il existe de nombreuses autres options pour créer un site Web en plus de PHP. Cet article vous donnera un aperçu approfondi des options de création de votre site Web autres que PHP et vous fournira des exemples de code concrets. PythonPython est un langage de programmation puissant et facile à apprendre, largement utilisé dans le développement Web. Utiliser Python

Mesures de sécurité pour les sites Web PHP Mesures de sécurité pour les sites Web PHP

02 May 2024

Introduction aux mesures de sécurité des sites Web PHP Il est crucial de protéger votre site Web contre les cybermenaces. Pour les sites Web PHP, prendre des mesures de sécurité appropriées est essentiel pour garantir la confiance des données et des utilisateurs. Cet article abordera une série de mesures de protection de sécurité PHP efficaces et pratiques et fournira des illustrations de cas pratiques. 1. Objectif de vérification des entrées : empêcher les entrées malveillantes de provoquer l’exécution de code ou des attaques par injection SQL. Méthode : utilisez des fonctions PHP intégrées (telles que filter_input()) ou des bibliothèques tierces (telles que htmlpurifier) ​​​​​​pour vérifier les entrées de l'utilisateur et filtrer les caractères malveillants et les codes HTML. Cas pratique :

Pourquoi le développement de sites Web php est-il si efficace ? Pourquoi le développement de sites Web php est-il si efficace ?

07 May 2020

Les raisons pour lesquelles le développement de sites Web PHP est efficace : 1. PHP est un langage faiblement typé, qui est plus efficace que d'autres langages fortement typés ; 2. PHP est livré avec de puissantes bibliothèques de fonctions, telles que json_encode, diverses opérations sur les tableaux et divers tris ; . Le tableau array en php améliore considérablement l'efficacité du développement.

See all articles