ホームページ > php教程 > php手册 > 如何抓取“深圳之窗”的新闻

如何抓取“深圳之窗”的新闻

WBOY
リリース: 2016-06-13 10:23:53
オリジナル
839 人が閲覧しました

最近不少网友来问我如何用PHP来抓取其他网站的新闻,开始我担心会侵权,一直没公开。但问的人太多了,这里我举个例子 ---- 如何抓取“深圳之窗”的新闻,仅供大家参考使用思路。请大家自觉,不要做违规的事。谢谢。
抓取“科技新闻”目录代码页(readNews.php):
$url = "http://news.szptt.net.cn/kjxw.phtml";
if(isset($url)&&$url!="") {
$str = implode("",file($url));
$str_ary = explode("

    ",$str);
    $str_ary = explode("",$str_ary[1]);
    for ($i=0; $iecho $str_ary[$i];
    }
    }
    ?>


    相关文章
    ? 如何抓取“深圳之窗”的新闻
    最近不少网友来问我如何用PHP来抓取其他网站的新闻,开始我担心会侵权,一直没公开。但问的人太多了,这里我举个例子 ---- 如何抓取“深圳之窗”的新闻,仅供大家参考使用思路。请大家自觉,不要做违规的事。谢谢。

    抓取“科技新闻”详细内容代码页(readNewsDetail.php):
    CTOHome.com 科技新闻频道
    /*
    * ctohome.com 深圳新闻
    */
    $url_ary = explode("/",$url);
    $url = $url_ary[count($url_ary)-2] . "/" . $url_ary[count($url_ary)-1];
    $url = "http://news.szptt.net.cn/" . $url;
    if(isset($url)&&$url!="") {
    $str = implode("",file($url));
    $str_ary = explode("echo "
    ";
    for ($i=4; $iecho "
    }
    echo "";
    }
    ?>
    抓取的方法要视不同的原代码而定,事前要仔细分析你要抓取的页的HTML原代码,然后找出规律,最后才写代码。IE对HTML语法的纠错功能很强,所以只要显示结果正确,抓取后的代码有些语法错误也没关系。
ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
人気のおすすめ
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート