PHP は、Baidu ホットワードで検索された http://top.baidu.com/buzz/top10.html のソース コードをキャプチャし、プライベートにチャットできます。
リリース: 2016-07-25 08:46:37
以前の PHP 開発プロセスでは、Baidu のホットワードと Baidu の検索ランキングの TOP50 を使用する必要がある、ナビゲートする必要がある Web サイトがありました。
FOR ループに基づいて 50 個のアイテムを見つけることができます simple_html_dom.php に基づいてこれらのアドレスを取得できます simple_html_dom.php Baidu はそれを同じディレクトリに配置します 私は THINKPHP を使用し、同じアクションに配置します //http://top.baidu.com/buzz/top10.html //http://top.baidu.com/buzz?b=1&c=513 //http://top.baidu.com/バズ?b=1&fr=topcategory_c513
- $now_url = 'http://top.baidu.com/buzz.php?p=top10';
- $content = '';
- if (function_exists ( 'curl_init' )) {
- $ch =curl_init ( $now_url );
- curl_setopt ( $ch, CURLOPT_HEADER, 0 );
- curl_setopt ( $ch, CURLOPT_TIMEOUT, 30 ); // 無限ループを防ぐためにタイムアウト制限を設定します
- curl_setopt ( $ch, CURLOPT_USERAGENT, "Mozilla/4.0 (互換) ; MSIE 6.0; Windows NT 5.0)" );
- //curl_setopt ( $ch, CURLOPT_USERAGENT,
- // "Baiduspider+(+http://www.baidu.com/search/spider.htm)" );
- curl_setopt ( $ ch, CURLOPT_RETURNTRANSFER, 1 );
- $content =curl_exec ( $ch );
- curl_close ( $ch );
- } elseif (function_exists ( 'file_get_contents' )) {
- $content = file_get_contents ( $now_url );
- } else {
- exit ( 'サーバーは同時にコンポーネントをサポートしていないため、収集を開始できません!' );
- }
- include_once ('simple_html_dom.php');
- // 新しい Dom インスタンスを作成します
- $html = new simple_html_dom ( );
- // 文字列からロード
- $html->load ( $content ); // syncad_3
- $new1 = $html->find ( 'table .keyword .list-title text' ); // によるtable -title のキーワードリスト タグ下のデータを検索
- $keyArray = array ();
- for($i = 0; $i $item = iconv ( "GB2312 ", "UTF- 8", $new1 [$i] . '' );
- $keyArray [] = $item;
- }
- $this->assign ( 'keyArray', $keyArray );
- $html- >クリア () ;
- 設定解除 ( $html );
コードをコピー
|
トップ、百度、php
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
著者別の最新記事
-
2024-10-22 09:46:29
-
2024-10-13 13:53:41
-
2024-10-12 12:15:51
-
2024-10-11 22:47:31
-
2024-10-11 19:36:51
-
2024-10-11 15:50:41
-
2024-10-11 15:07:41
-
2024-10-11 14:21:21
-
2024-10-11 12:59:11
-
2024-10-11 12:17:31