首页 > php教程 > php手册 > PHP采集CSDN博客边栏的阅读排行

PHP采集CSDN博客边栏的阅读排行

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB
发布: 2016-06-16 09:16:22
原创
1106 人浏览过

PHP采集CSDN博客边栏的阅读排行

  项目中要用到采集的数据,所以就先拿CSDN博客来试了试。这里使用Simple HTML DOM(官网)这个库,它能够方便的遍历HTML文档。

<?php
    include_once('simple_html_dom.php');
    header('Content-Type:text/html;charset=utf-8');
    $html = file_get_html('http://blog.csdn.net/szy361');

    $res = $html->find('#hotarticls ul.panel_body li a[title]');//取得id=hotarticls下class为panel_bodya的ul标签下的a的title
    $span = $html->find('#hotarticls ul.panel_body li span');//取得span
    foreach($res as $element){
        $arr[] = $element->title.'&#43;'.$element->href;//将title&#20540;和href的&#20540;通过&#43;连起来
    }
    foreach($span as $e){
        $brr[] = $e->innertext;//得到span下的&#20540;组成的数组
    }
    
    //将两个数组组成一个新的二维数组
    for($i=0;$i<count($res);$i&#43;&#43;){
        $crr[] = explode('&#43;',$arr[$i]);
        $crr[$i][] = $brr[$i];
    }
    return $crr;
登录后复制

扩展:

PHP Simple HTML DOM解析器使用入门

相关标签:
本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
可有博客模板
来自于 1970-01-01 08:00:00
0
0
0
后台发布博客的编辑器是真的难用
来自于 1970-01-01 08:00:00
0
0
0
php中文网的博客的域名能更改吗?
来自于 1970-01-01 08:00:00
0
0
0
热门推荐
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板