采集初级的用php写的采集程序-tutoriel php-php.cn

Maison

développement back-end

tutoriel php

采集初级的用php写的采集程序

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jul 29, 2016 am 08:36 AM

采集

可以先用这个采集然后在用帝国处理
####################################################################################
#作者：9elong
#网站：个人小站不值一提
#时间：2007-01-01
#声明：仅用于学习php之用。
#功能：采集单页面图片。
#说明：3个示范表单已经写好正则用来示范。没有任何功能说明，一切都在源代码里。附加论坛图片采集正则示范
####################################################################################
//把图片从信息页抓取下来的函数
function  getimg($url,$n,$key,$imgqian,$imgbiao,$titlekey)
{
                //$key图片地址正则
                //$titlekey图片标题正则
                //$imgqian图片地址前缀
                //$imgbiao图片地址特殊标识
                global  $n;
                global  $msg;
                global  $result;
                global  $imgadd;
                global  $title;
                $msg=file_get_contents($url);
                $key=str_replace("{图片地址}","(.+)",$key);
                $key="|".$key."|isU";
                preg_match_all($key,$msg,$result);
                $c=count($result[0]);
                for($i=0;$i                {
                                $img=$result[0][$i]."
";
                                if(ereg("^.*".$imgbiao.".*$",$img))
                                {
                                                $img=str_replace($imgbiao,$imgqian.$imgbiao,$img);
                                                preg_match("|http://(.+)jpg|isU",$img,$img);
                                                $imgadd[$n]=$img[0];
                                                //echo  " 采集初级的用php写的采集程序
";
                                                $n++;
                                }
                                elseif(ereg("^.*jpg.*$",$img))
                                {
                                                preg_match("|http://(.+)jpg|isU",$img,$img);
                                                $imgadd[$n]=$img[0];
                                                if($img[0]!="")
                                                $n++;
                                }
                                unset($img);
                }
                                $titlekey=str_replace("{图片标题}","(.+)",$titlekey);
                                $titlekey="|".$titlekey."|isU";
                                preg_match($titlekey,$msg,$title);
                                //echo  $title[0];
                                return  $title;
                return  $msg;
                return  $result;
                return  $n;
                return  $imgadd;
}
####################################################################################
#不支持file_get_contents()函数可以使用下面的替换
#$i=0;
#$handle=@fopen($url,"rb");
#while  (!@feof($handle))
#{
#                $buffer[$i]=  @fgets($handle,  4096);
#                $i++;
#}
#fclose($handle);
#$msg=join("",$buffer);
####################################################################################
if($_GET['act']=="getimgadd"&&$_POST['url']!="")
{
                $url=$_POST['url'];
        getimg($url,"0",$_POST['key'],$_POST['imgqian'],$_POST['imgbiao'],$_POST['titlekey']);
####################################################################################
        //获取分页
                if($_POST['getpage']=="是")
        {
                                $_POST['page']=str_replace("{分页地址}","(.+)",$_POST['page']);
                $page="|".$_POST['page']."|isU";
                //echo  $page;
        preg_match_all($page,$msg,$presult);
                if($_POST['pc']==""||$_POST['pc']=="全部")
                        $pc=count($presult[0]);
                else
                                $pc=$_POST['pc'];
                if($_POST['pc']>count($presult[0]))
                                $pc=count($presult[0]);
                for($i=1;$i                {
                                $pageurl=$presult[0][$i];
                                //echo  $pageurl."
";
                                if(ereg("^.*[1-9].*$",$pageurl))
                                {
                                                $pageurl=str_replace("                                                $pagekey=str_replace("{关键地址}","(.+)",$_POST['pagekey']);
                                                $pagekey="|".$pagekey."|isU";
                                                preg_match($pagekey,$pageurl,$N3[$i]);
                                                //echo  ($N3[$i][0])."
";
                                                getimg($N3[$i][0],$n,$_POST['key'],$_POST['imgqian'],$_POST['imgbiao'],$_POST['titlekey']);
                                }
                }
        }
####################################################################################
        echo  "图片集〖".$title[1]."〗".$n."张图片被抓取
 返回首页
";
                while(list($num,$var)=each($imgadd))
                {
                                if($_POST['showtype']=="图片")
                                {
                                                echo  " 采集初级的用php写的采集程序
";
                                }
                                else
                                echo  $var."
";
                }
####################################################################################
                //exit();
}
?>
实例1(信息页有分页，使用了简单的分页正则)：

实例2(信息页没有分页，所以分页正则为空)：

实例3(信息页没有分页，所以分页正则为空,图片为绝对地址，所以图片地址前缀为空)：

华声论坛图片为附件http://bbs.hnol.net/dispbbs2.asp?boardID=50&ID=336436
图片地址正则:upload=jpg{图片地址}upload
图片地址标识:bbs
图片标题正则:帖子主题：{图片标题}
华声论坛图片为外链http://bbs.hnol.net/dispbbs2.asp?boardID=50&ID=336253
图片地址正则:img]{图片地址}/img
图片地址标识:jpg
图片标题正则:帖子主题：{图片标题}

以上就介绍了采集初级的用php写的采集程序，包括了采集方面的内容，希望对PHP教程有兴趣的朋友有所帮助。

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

Générez AI Hentai gratuitement.

Afficher plus

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)

4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Meilleurs paramètres graphiques

4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Solution d'énigmes de coquille

2 Il y a quelques semaines By DDD

R.E.P.O. Comment réparer l'audio si vous n'entendez personne

4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

WWE 2K25: Comment déverrouiller tout dans Myrise

1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌

Afficher plus

Outils chauds

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Afficher plus

Sujets chauds

Où se trouve l'entrée de connexion pour la messagerie Gmail ?

7509

Tutoriel CakePHP

1378

Quel est le format du nom de compte de Steam

Clé d&amp;amp;amp;amp;amp;amp;#39;activation Win11 permanent

NYT Connexions Indices et réponses

Afficher plus

Related knowledge

Notification complète du stockage iCloud : comment y remédier Apr 24, 2024 pm 04:43 PM

Votre iPhone affiche-t-il « iCloud Storage Full » chaque fois que vous téléchargez des fichiers ou que vous déposez quelque chose ? Le plan gratuit de stockage iCloud est limité à seulement 5 Go. Par conséquent, la première chose que vous devez vérifier est la situation actuelle du stockage iCloud sur votre téléphone. S'il reste encore suffisamment d'espace de stockage et que vous recevez une notification, ces solutions vous aideront à dépanner. Correctif 1 – Supprimer la sauvegarde iCloud Supprimez la version existante de la sauvegarde iCloud des paramètres de votre téléphone. Étape 1 – Ouvrez les paramètres. Étape 2 – Vous trouverez votre identifiant Apple en haut du panneau Paramètres. Cliquez dessus pour l'ouvrir. Étape 3 – Activez « iCloud » pour ouvrir les paramètres iCloud. Étape 4 – Vers le bas

Comment utiliser le langage Go pour la collecte de données en temps réel ? Jun 10, 2023 pm 05:46 PM

Avec le développement continu de la technologie de l’Internet des objets, la collecte de données en temps réel est devenue un élément indispensable de l’ère numérique. Parmi les différents langages de programmation, le langage Go est devenu un choix idéal pour la collecte de données en temps réel grâce à ses performances de concurrence efficaces et sa syntaxe concise. Cet article explique comment utiliser le langage Go pour la collecte de données en temps réel. 1. Sélection du cadre de collecte de données Avant d'utiliser le langage Go pour la collecte de données en temps réel, nous devons choisir un cadre de collecte de données qui nous convient. Les cadres de collecte de données les plus populaires actuellement sur le marché comprennent

iPhone bloqué en mode Ne pas déranger : comment y remédier May 03, 2024 pm 09:07 PM

Votre iPhone est bloqué en mode Ne pas déranger ? Cela peut être gênant si vous ne parvenez pas à activer le mode Ne pas déranger. Vous ne recevrez aucune alerte. Il ne faudra pas beaucoup d’efforts pour résoudre ce problème MDN sur iPhone. Alors, plus besoin de perdre du temps et suivez simplement ces solutions simples pour résoudre votre problème. Correctif 1 – Supprimer le programme Ne pas déranger Si vous avez un programme Ne pas déranger sur votre téléphone, cela peut forcer l'appareil à passer automatiquement en mode Ne pas déranger. Étape 1 – Accédez aux paramètres de votre iPhone. Étape 2 – Ensuite, activez le mode Focus. Étape 3 – Vous trouverez « Ne pas déranger » en haut du graphique. Étape 4 – Ouvrez-le. Étape 5 – Sur la page suivante, si vous accédez à l'onglet Calendrier, vous

L'écran de l'iPhone revient sans cesse à l'écran d'accueil Apr 17, 2024 am 08:28 AM

L’écran de votre iPhone revient-il à l’écran d’accueil chaque fois que vous ouvrez une application spécifique ? Il s'agit d'un comportement inhabituel et la raison pour laquelle vous revenez à l'écran d'accueil est que l'application est tombée en panne pour une raison quelconque. Le dépannage sera plus facile si vous suivez ces instructions. Correctif 1 – Modifier le comportement du clic L'un des gestes arrière sur iPhone vous permet de minimiser l'application actuelle. La désactivation du comportement de clic devrait résoudre ce problème. Étape 1 – Ouvrez les paramètres. Étape 2 – Plus tard, visitez les paramètres d’accessibilité pour l’activer. Étape 3 – Accédez à la fonction « Physique et moteurs » et ouvrez les paramètres « Toucher ». Étape 4 – Faites glisser votre doigt jusqu'aux paramètres « BackTap ». Ouvrez-le. Étape 5 – Sur la page Retour Clic, sélectionnez

Impossible de vérifier l'erreur de mise à jour sur iPhone : correctif Apr 17, 2024 pm 10:40 PM

Recevez-vous ce message d'erreur « Impossible de vérifier les mises à jour » lors de la vérification des mises à jour sur votre iPhone ? Habituellement, ce message apparaît lorsque vous recherchez manuellement des mises à jour alors que votre téléphone est hors ligne. Par conséquent, nous vous recommandons d'activer les données Wi-Fi/cellulaires et d'effectuer à nouveau la même opération. Si le problème persiste, suivez les conseils de dépannage restants. Correctif 1 – Activer les données Wi-Fi/cellulaires Activez les données Wi-Fi ou cellulaires et essayez à nouveau de vérifier les mises à jour. Étape 1 – Faites simplement glisser votre doigt vers le bas pour accéder au centre de contrôle. Étape 2 – Activez le Wi-Fi ou le cellulaire sur votre téléphone. Essayez maintenant à nouveau le processus de mise à jour après avoir activé la connectivité réseau. Correctif 2 – Forcer le redémarrage de l'iPhone si Wi-Fi/Bee est activé malgré

Analyse des fonctions de connexion automatique aux pages et de gestion de session de la mise en œuvre Python de l'application d'acquisition de navigateur sans tête Aug 09, 2023 pm 07:06 PM

Analyse des fonctions de connexion automatique aux pages et de gestion de session de Python pour implémenter des applications de collecte de navigateurs sans tête Introduction : Avec le développement rapide d'Internet, nos vies sont de plus en plus indissociables des applications réseau. Pour de nombreuses applications de type Web, nous devons nous connecter manuellement pour obtenir plus d'informations ou utiliser certaines fonctions. Afin d'améliorer l'efficacité, nous pouvons mettre en œuvre des fonctions automatiques de connexion aux pages et de gestion des sessions via des scripts automatisés. Navigateur sans tête : avant de mettre en œuvre des fonctions de connexion automatique aux pages et de gestion de session, nous devons d'abord comprendre ce qu'est un navigateur sans tête.

Introduction aux fonctions de base et à l'utilisation de Python pour implémenter des applications de collecte de navigateurs sans tête Aug 08, 2023 am 09:13 AM

Introduction aux fonctions de base et à l'utilisation des applications de collecte de navigateurs sans tête en Python Avec le développement d'Internet, la technologie des robots d'exploration joue un rôle important dans la collecte de données et l'exploration d'informations. Un navigateur sans tête est un navigateur sans interface qui peut simuler les opérations des utilisateurs en arrière-plan, accéder aux pages Web et récupérer les données requises. Python fournit une variété de bibliothèques et d'outils pour implémenter les fonctions d'un navigateur sans tête. Cet article explique comment utiliser Python pour implémenter les fonctions de base d'un navigateur sans tête et fournit des exemples de code correspondants. 1. Navigateur sans tête

Explication détaillée de la fonction de synchronisation et de mise à jour des données de page de Python pour implémenter une application de collecte de navigateur sans tête Aug 09, 2023 pm 05:09 PM

Explication détaillée des fonctions de synchronisation et de mise à jour des données de page de Python pour les applications de collecte de navigateurs sans tête Avec le développement rapide d'Internet, de plus en plus d'applications doivent interagir avec les pages Web pour obtenir des données. Lors de la mise en œuvre d'une telle fonction, une méthode courante consiste à utiliser un navigateur sans tête pour simuler les opérations de l'utilisateur afin d'obtenir des données sur la page Web. Cet article présentera en détail comment utiliser Python et un navigateur sans tête pour implémenter les fonctions de synchronisation et de mise à jour des données de page de l'application, et fournira des exemples de code correspondants. Préparation de l'environnement Tout d'abord, nous devons installer le Python correspondant

See all articles

采集 初级的用php写的采集程序

Outils d'IA chauds

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

Article chaud

Outils chauds

Bloc-notes++7.3.1

SublimeText3 version chinoise

Envoyer Studio 13.0.1

Dreamweaver CS6

SublimeText3 version Mac

Sujets chauds

采集初级的用php写的采集程序