Maison > php教程 > PHP源码 > le corps du texte

抓取文章列表

PHP中文网
Libérer: 2016-05-23 17:10:00
original
971 Les gens l'ont consulté

跳至

<?php
/**
 * 
 * @authors HG (hg0728@qq.com)
 * @date    2015-05-22 17:00:48
 * @version 1.0
 */
header("Content-type:text/html;charset=utf-8");
function getCurl($url) {
		$ch = curl_init();
		curl_setopt($ch, CURLOPT_URL, $url);
		curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
		curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false);
		curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, false);
		$result = curl_exec($ch);
		curl_close($ch);
		return $result;
}

function preg_list($str){//从curl获得指定内容
	$regex = &#39;/(.*?)/&#39;;
	$isMatched = preg_match_all($regex, $str, $matches);

	for ($i=0; $i < $isMatched; $i++) { 
		$str = $matches[1][$i] .&#39; &#39;. $matches[2][$i];
		echo $matches[1][$i];
		file_put_contents(&#39;blogs.txt&#39;, $str. "\n", FILE_APPEND);

		
	}
}
for ($i=0; $i < 201; $i++) { //翻页抓取
	if($i==0){
		$url = &#39;http://www.cnblogs.com/&#39;;
		$str = getCurl($url);
	}
	else {
		$url = &#39;http://www.cnblogs.com/sitehome/p/&#39;.$i;
		$str = getCurl($url);
	}
	preg_list($str);
}
Copier après la connexion

                   

Étiquettes associées:
source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Recommandations populaires
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal
À propos de nous Clause de non-responsabilité Sitemap
Site Web PHP chinois:Formation PHP en ligne sur le bien-être public,Aidez les apprenants PHP à grandir rapidement!