PHP는 Baidu 핫워드로 검색된 http://top.baidu.com/buzz/top10.html의 소스 코드를 캡처하고 비공개 채팅을 할 수 있습니다.
풀어 주다: 2016-07-25 08:46:37
前面开发PHP 的过程中、有一个网站要做一个导航的、需要用到百度热词、百度搜索榜的 TOP50 。
可以根据FOr 循环找出50 条 地址可为这几个都可以抓取 是根据simple_html_dom.php simple_html_dom.php 百度一下 放到相同的目录下 我用的是THINKPHP 放在同Action中 //http://top.baidu.com/buzz/top10.html //http://top.baidu.com/buzz?b=1&c=513 //http://top.baidu.com/buzz?b=1&fr=topcategory_c513
- $now_url = 'http://top.baidu.com/buzz.php?p=top10';
- $content = '';
- if (function_exists ( 'curl_init' )) {
- $ch = curl_init ( $now_url );
- curl_setopt ( $ch, CURLOPT_HEADER, 0 );
- curl_setopt ( $ch, CURLOPT_TIMEOUT, 30 ); // 设置超时限制防止死循环
- curl_setopt ( $ch, CURLOPT_USERAGENT, "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0)" );
- // curl_setopt ( $ch, CURLOPT_USERAGENT,
- // "Baiduspider ( http://www.baidu.com/search/spider.htm)" );
- curl_setopt ( $ch, CURLOPT_RETURNTRANSFER, 1 );
- $content = curl_exec ( $ch );
- curl_close ( $ch );
- } elseif (function_exists ( 'file_get_contents' )) {
- $content = file_get_contents ( $now_url );
- } else {
- exit ( '您的服务器同时不支持组件,无法开始采集!' );
- }
- include_once ('simple_html_dom.php');
- // 新建一个Dom实例
- $html = new simple_html_dom ();
- // 从字符串中加载
- $html->load ( $content ); // syncad_3
- $new1 = $html->find ( 'table .keyword .list-title text' ); // 根据table的keyword list-title查出该标签下的数据
- $keyArray = array ();
- for($i = 0; $i < 20; $i ) {
- $item = iconv ( "GB2312", "UTF-8", $new1 [$i] . '' );
- $keyArray [] = $item;
- }
- $this->assign ( 'keyArray', $keyArray );
- $html->clear ();
- unset ( $html );
复制代码
|
탑, 바이두, PHP
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
-
2024-10-22 09:46:29
-
2024-10-13 13:53:41
-
2024-10-12 12:15:51
-
2024-10-11 22:47:31
-
2024-10-11 19:36:51
-
2024-10-11 15:50:41
-
2024-10-11 15:07:41
-
2024-10-11 14:21:21
-
2024-10-11 12:59:11
-
2024-10-11 12:17:31