首页 > 后端开发 > php教程 > php如何抓取网页数据?

php如何抓取网页数据?

PHPz
发布: 2020-06-05 12:43:06
原创
4096 人浏览过

php如何抓取网页数据?

php抓取网页数据

header("Content-type: text/html; charset=utf-8");
//$url = "https://www.cnblogs.com/chenliyang/p/6554647.html";
//$html = file_get_contents($url);
////如果出现中文乱码使用下面代码
////$getcontent = iconv("gb2312", "utf-8",$html);
//echo "<textarea style=&#39;width:800px;height:600px;&#39;>".$html."</textarea>"; //获取整个内容
登录后复制

第一种 file_get_contents 抓取

file_get_contents() 把整个文件读入一个字符串中。

该函数是用于把文件的内容读入到一个字符串中的首选方法。如果服务器操作系统支持,还会使用内存映射技术来增强性能。

$url = &#39;http://www.baidu.com&#39;; //这儿填页面地址
$info=file_get_contents($url);
//preg_match(&#39;|<title>(.*?)<\/title>|i&#39;,$info,$m);
$m1=preg_match(&#39;|<title>(.*?)<\/title>|&#39;,$info,$m);
//var_dump($m1);
 echo $m[1]; //获取标题
 echo &#39;<br/>&#39;;
登录后复制

第二种 curl抓取,

$url = "http://www.baidu.com";
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 10);
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
$html = curl_exec($ch);
curl_close($ch);
 
$m1=preg_match(&#39;|<title>(.*?)<\/title>|&#39;,$html,$ms);
//echo "<textarea style=&#39;width:800px;height:600px;&#39;>".$html."</textarea>";  //获取整个内容
//curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
echo $ms[1]; //获取标题
echo &#39;<br/>&#39;;
登录后复制

更多相关知识,请访问 PHP中文网!!

相关标签:
来源:php.cn
本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板