PHP を使用して Google キーワード ランキングを取得する_PHP チュートリアル

WBOY
リリース: 2016-07-13 17:47:15
オリジナル
1362 人が閲覧しました

 

说下思路,利用PHP的curl函数储存cookie,google搜索页面是无法用file_get_connents打开的,必须要完全模拟浏览器才行,百度就不同了,直接用file_get_conntens抓取页面,然后用正则处理下就行了,这里就不列举百度了。

 

header("Content-Type: text/html;charset=utf-8");

function ggsearch($url_s, $keyword, $page = 1) {

$enKeyword = urlencode($keyword);

$rsState = false;

$page_num = ($page -1) * 10;

if ($page <= 10) {

$interface = "eth0:" . rand(1, 4); //避免GG封IP

$cookie_file = dirname(__FILE__) . "/temp/google.txt"; //存储cookie值

$url = "http://www.google.com/search?q=$enKeyword&hl=en&prmd=imvns&ei=JPnJTvLFI8HlggeXwbRl&start=$page_num&sa=N";

$ch = curl_init();

curl_setopt($ch, CURLOPT_URL, $url);

//curl_setopt($ch, CURLOPT_USERAGENT, $_SERVER['HTTP_USER_AGENT']);//获取浏览器类型

curl_setopt($ch, CURLOPT_USERAGENT, "Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.2) Gecko/20090729 Firefox/3.5.2 GTB5");

curl_setopt($ch, CURLOPT_INTERFACE, "$interface"); //指定访问IP地址

curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);

curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);

curl_setopt($ch, CURLOPT_COOKIEJAR, $cookie_file);

$contents = curl_exec($ch);

curl_close($ch);

$match = "!(.*)

s+!";

                preg_match_all("$match", "$contents", $line);

                while (list ($k, $v) = each($line[0])) {

                        preg_match_all("!]+>(.*?)!", $v, $title);

                        $num = count($title[1]);

                        for ($i = 0; $i

                                if (strstr($title[0][$i], $url_s)) {

                                        $rsState = true;

                                        $j = $i +1;

                                        $sum = $j + (($page) * 10 - 10);

                                        // $contents をエコー;

                                        「关键字」をエコーし​​ます。 $キーワード 。 "
" 。 「排名:」 . '' 。 $sum 。 '' 。 「####」 。 「第」 。 ''.$page 。 「」。 「 页 」 。 "第" .''.$j 。 「」。 「名前」 。 $title[0][$i] 。 "
";

                                        echo "

echo "


";

}

}

if (!empty ($_POST['submit'])) {

$time =explode(' ', microtime());

$start = $time[0] + $time[1];

$more_key = トリム($_POST['textarea']);

$url_s = トリム($_POST['url']);

If (!empty ($more_key) && !empty ($url_s)) {

/*入力文字のパターンを判定*/

If (strstr($more_key, "n")) {

$exkey =explode("n", $more_key);

}

If(strstr($more_key, "|")) {

$exkey =explode("|", $more_key);

}

If(!strstr($more_key, "n")&&!strstr($more_key, "|")){

$exkey=array($more_key);

}

/*www または http://*/

のようなものが存在するかどうかを判断します

If (count(explode('.', $url_s))

$url = ltrim($url_s, 'http://www');

$url = 'www.'

}

foreach ($exkey を $keyword として) {

                                                                                                  

ggsearch($ url_s、$ keyword);

}

$endtime =explode(' ', microtime());

$end = $endtime[0] + $endtime[1];

echo '


';

echo 'プログラムの実行時間: ';

エコー $end - $start;

//die();

}

}

?>

<頭>

フェッチランキング

<フォームアクション=""メソッド="投稿">

& Lt; スパン & gt; キーワード: & lt;/スパン & gt; テキストエリア名 = "20" カラー = "オフ" & gt;

フォーマット例: キーワード1|キーワード2|キーワード3

または: キーワード1

キーワード2

キーワード3

& Lt; スパン & gt; 入力タイプ = "テキスト" & gt;

&lt;入力タイプ= "submit" name = "" submit "value =" search "&gt;

www.2cto.com

Shine's Holy Heaven-〃ミン〃

より抜粋

http://www.bkjia.com/PHPjc/478516.html

tru​​ehttp://www.bkjia.com/PHPjc/478516.html技術記事アイデアについて話しましょう。Cookie を保存するには、Google 検索ページを開くことはできません。これは、ブラウザを完全にシミュレートする必要があります...
ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
最新の問題
人気のおすすめ
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート