Maison > développement back-end > tutoriel php > Applet de collecte implémenté en PHP, une lecture incontournable pour ceux qui souhaitent collecter des données

Applet de collecte implémenté en PHP, une lecture incontournable pour ceux qui souhaitent collecter des données

PHPz
Libérer: 2023-03-07 09:22:01
original
3425 Les gens l'ont consulté

Ce qui suit est une applet de collection implémentée en PHP que j'ai collectée. Elle peut être utilisée pour tester par vous-même. C'est très pratique pour la collecte !

<?php
//调用方法 :localhost/2.php?id=1 (自动采集1-8的列表)
header("Content-type:text/html;charset=utf-8");

$con =mysql_connect("localhost", "root", "huweishen.com") or die("数据库链接错误");
mysql_select_db("liuyan", $con);
mysql_query("set names &#39;utf8&#39;");

function preg_substr($start, $end, $str) // 正则截取函数        
{        
    $temp = preg_split($start, $str);        
    $content = preg_split($end, $temp[1]);        
    return $content[0];        
}     
function str_substr($start, $end, $str) // 字符串截取函数        
{        
    $temp = explode($start, $str, 2);        
    $content = explode($end, $temp[1], 2);        
    return $content[0];       
}     
// ---------------- 使用实例 ----------------     
 
if($_GET[&#39;id&#39;]<=8&&$_GET[&#39;id&#39;]){

$id=$_GET[&#39;id&#39;];
$url = "http://www.037c.com/New/list_5_$id.html"; //目标站
$fp = fopen($url, "r") or die("超时");
$fcontents = file_get_contents($url);
$pattern="/<\/span><a href=\"(.*)\" title=\"(.*)\"  target=\"_blank\">/iUs";//正则
preg_match_all($pattern, $fcontents, $arr);
//print_r($arr);
         foreach($arr[1] as $k=>$url)
         {   
	     $title = iconv(&#39;GB2312&#39;, &#39;UTF-8&#39;, addslashes($arr[2][$k])); 
		// echo $title;
		// echo $url; 
	    $str = iconv("GB2312","UTF-8",  file_get_contents($url));  
        $author = preg_substr("/作者:/", "/<\//", $str); // 通过正则提取作者     
        $content = str_substr(&#39;<p class="wltg">&#39;, &#39;</p>&#39;, $str); //通过字符串提取标题     
		$sql = "INSERT  INTO  `caiji` (`title`, `url` , `content`, `author` ) VALUES (&#39;$title&#39;, &#39;$url&#39; , &#39;$content&#39; , &#39;$author&#39;)";

		// echo $sql."<br/>";
         mysql_query($sql);
         }  

     $id++;
    echo "正在采集URL数据列表$id...请稍后...";
    echo "<script>window.location=&#39;2.php?id=$id&#39;</script>";
  }

else{
   echo "采集数据结束。";
 }
?>
Copier après la connexion


Le paramètre de titre est unique, ce qui peut empêcher une collecte répétée. C'est une très bonne applet de collection php, auteur : Fengyun Wuji

.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Étiquettes associées:
source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal