如何用PHP获取网站收录的内容
这篇文章主要讲了如何用PHP获取网站收录的内容,有一定的参考价值,感兴趣的朋友可以看看。
<?php class SEO_RankChecker { private $url; public function __construct($url) { $this->url = preg_replace('/http\:\/\//si', '', $url); } private function getContent($url) { $snoopy=new Snoopy(); $snoopy->agent='Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US) AppleWebKit/534.7 (KHTML, like Gecko) Chrome/7.0.517.41 Safari/534.7'; $snoopy->fetch($url); if($snoopy->status==200) { $charset='utf-8'; $snoopy->results=strtolower($snoopy->results); //首先从html获取编码 preg_match("/<meta.+?charset=[^\w]?([-\w]+)/i",$snoopy->results,$temp) ? strtolower($temp[1]):""; if(isset($temp[1])!="") { $charset=$temp[1]; } else if(!empty($snoopy->headers)) { //从header中获取编码 $hstr=strtolower(implode("|||",$snoopy->headers)); preg_match("/charset=[^\w]?([-\w]+)/is",$hstr,$lang) ? strtolower($lang[1]):""; if($lang[1]!="") { $charset=$lang[1]; } else { $encode_arr=array("UTF-8","GB2312","GBK","BIG5","ASCII","EUC-JP","Shift_JIS","CP936","ISO-8859-1","JIS","eucjp-win","sjis-win"); $encoded=mb_detect_encoding($snoopy->results,$encode_arr); if($encoded) { $charset=strtolower($encoded); } } } else { $encode_arr=array("UTF-8","GB2312","GBK","BIG5","ASCII","EUC-JP","Shift_JIS","CP936","ISO-8859-1","JIS","eucjp-win","sjis-win"); $encoded=mb_detect_encoding($snoopy->results,$encode_arr); if($encoded) { $charset=strtolower($encoded); } } if($charset!="utf-8" && $charset!==false) { $snoopy->results=mb_convert_encoding($snoopy->results,"UTF-8",$charset); } return $snoopy->results; } else { return ''; } } //获取alexa排名 public function getAlexaRank() { $url = $this->url; $xml = @simplexml_load_string(file_get_contents('http://data.alexa.com/data?cli=10&url=' . $url)); return $xml ? $xml->SD->POPULARITY['TEXT'] : ''; } //如果被dmoz收录就返回dmoz的目录名称 public function getDmoz() { $url = preg_replace('/^www\./', '', $this->url); $url = "http://search.dmoz.org/cgi-bin/search?search=$url"; $data = $this->getContent($url); if(preg_match('<center>No <b><a href="http://dmoz\.org/">Open Directory Project</a></b> results found</center>', $data)) { $value = false; } else { $value = true; } return $value; } //如果被yahoo收录就返回yahoo的目录名称 public function getYahooDirectory() { $url = preg_replace('/^www\./', '', $this->url); $url = "http://search.yahoo.com/search/dir?p=$url"; $data = $this->getContent($url); if(preg_match('No Directory Search results were found\.', $data)) { $value = false; } else { $value = true; } return $value; } //获取Baidu收录 public function getIndexedBaidu() { $url = $this->url; $url = 'http://www.baidu.com/s?wd=site%3A'.urlencode($url); $data = $this->getContent($url); preg_match('/找到相关结果数([0-9\,]+)个/si', $data, $p); $value = isset($p[1]) ? $this->toInt($p[1]) : 0; return $value; } //获取google收录 public function getIndexedGoogle() { $url = $this->url; $url = 'http://www.google.com/search?hl=en&safe=off&btnG=Search&q=site%3A'.urlencode($url); $data = $this->getContent($url); preg_match('/([0-9\,]+) result/si', $data, $p); $value = isset($p[1]) ? $this->toInt($p[1]) : 0; return $value; } /** *功能:获取Google反链 *时间: 2011-10-13 下午11:28:45 */ public function getBacklinksGoogle() { $url = $this->url; $url = 'http://www.google.com/search?q=link%3A'.urlencode($url); $data = $this->getContent($url); preg_match('/of about \<b\>([0-9\,]+)\<\/b\>/si', $data, $p); $value = isset($p[1]) ? $this->toInt($p[1]) : 0; return $value; } /** *功能:获取Yahoo反链 *时间: 2011-10-13 下午11:28:45 */ public function getBacklinksYahoo() { $url = $this->url; $url = 'http://siteexplorer.search.yahoo.com/search?p='.urlencode($url); $data = $this->getContent($url); preg_match('/Inlinks \(([0-9\,]+)\)/si', $data, $p); $value = isset($p[1]) ? $this->toInt($p[1]) : 0; return $value; } //获取域名年龄 public function getAge() { $url = preg_replace('/^www\./', '', $this->url); $url = 'http://www.who.is/whois/'.urlencode($url); $data = $this->getContent($url); preg_match('#(?:Creation Date|Created On):\s*([a-z0-9/-]+)#si', $data, $p); if(!isset($p[1])) { return null; } $value = time() - strtotime($p[1]); return $value; } //获取yahoo的收录数量 public function getIndexedYahoo() { $url = $this->url; $url = 'http://siteexplorer.search.yahoo.com/search?p='.urlencode($url); $data = $this->getContent($url); preg_match('/Pages \(([0-9,]{1,})\)/im', $data, $p); $value = isset($p[1]) ? $this->toInt($p[1]) : 0; return $value; } /** *功能:获取PR *时间: 2011-10-13 下午11:27:19 */ public function getPagerank() { $chwrite = $this->CheckHash($this->HashURL($this->url)); $url="http://toolbarqueries.google.com/tbr?client=navclient-auto&ch=".$chwrite."&features=Rank&q=info:".$this->url."&num=100&filter=0"; $data = $this->getContent($url); preg_match('#Rank_[0-9]:[0-9]:([0-9]+){1,}#si', $data, $p); $value = isset($p[1]) ? $p[1] : 0; return $value; } private function toInt($string) { return preg_replace('#[^0-9]#si', '', $string); } //--> for google Piwik_SEO_Ranks private function StrToNum($Str, $Check, $Magic) { $Int32Unit = 4294967296; // 2^32 $length = strlen($Str); for($i = 0; $i < $length; $i++) { $Check *= $Magic; // If the float is beyond the boundaries of integer (usually +/- 2.15e+9 = 2^31), // the result of converting to integer is undefined // refer to http://www.php.net/manual/en/language.types.integer.php if($Check >= $Int32Unit) { $Check = ($Check - $Int32Unit * (int) ($Check / $Int32Unit)); //if the check less than -2^31 $Check = ($Check < -2147483648) ? ($Check + $Int32Unit) : $Check; } $Check += ord($Str{$i}); } return $Check; } /* * Genearate a hash for a url */ private function HashURL($String) { $Check1 = $this->StrToNum($String, 0x1505, 0x21); $Check2 = $this->StrToNum($String, 0, 0x1003F); $Check1 >>= 2; $Check1 = (($Check1 >> 4) & 0x3FFFFC0 ) | ($Check1 & 0x3F); $Check1 = (($Check1 >> 4) & 0x3FFC00 ) | ($Check1 & 0x3FF); $Check1 = (($Check1 >> 4) & 0x3C000 ) | ($Check1 & 0x3FFF); $T1 = (((($Check1 & 0x3C0) << 4) | ($Check1 & 0x3C)) <<2 ) | ($Check2 & 0xF0F ); $T2 = (((($Check1 & 0xFFFFC000) << 4) | ($Check1 & 0x3C00)) << 0xA) | ($Check2 & 0xF0F0000 ); return ($T1 | $T2); } //--> for google Piwik_SEO_Ranks /* * genearate a checksum for the hash string */ private function CheckHash($Hashnum) { $CheckByte = 0; $Flag = 0; $HashStr = sprintf('%u', $Hashnum) ; $length = strlen($HashStr); for($i = $length - 1; $i >= 0; $i --) { $Re = $HashStr{$i}; if(1 === ($Flag % 2)) { $Re += $Re; $Re = (int)($Re / 10) + ($Re % 10); } $CheckByte += $Re; $Flag ++; } $CheckByte %= 10; if(0 !== $CheckByte) { $CheckByte = 10 - $CheckByte; if(1 === ($Flag % 2) ) { if(1 === ($CheckByte % 2)) { $CheckByte += 9; } $CheckByte >>= 1; } } return '7'.$CheckByte.$HashStr; } } ?>
【相关教程推荐】
1. php编程从入门到精通全套视频教程
2. php从入门到精通
3. bootstrap教程

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

熱門話題

PHP 8.4 帶來了多項新功能、安全性改進和效能改進,同時棄用和刪除了大量功能。 本指南介紹如何在 Ubuntu、Debian 或其衍生版本上安裝 PHP 8.4 或升級到 PHP 8.4

Visual Studio Code,也稱為 VS Code,是一個免費的原始碼編輯器 - 或整合開發環境 (IDE) - 可用於所有主要作業系統。 VS Code 擁有大量針對多種程式語言的擴展,可以輕鬆編寫

本教程演示瞭如何使用PHP有效地處理XML文檔。 XML(可擴展的標記語言)是一種用於人類可讀性和機器解析的多功能文本標記語言。它通常用於數據存儲

JWT是一種基於JSON的開放標準,用於在各方之間安全地傳輸信息,主要用於身份驗證和信息交換。 1.JWT由Header、Payload和Signature三部分組成。 2.JWT的工作原理包括生成JWT、驗證JWT和解析Payload三個步驟。 3.在PHP中使用JWT進行身份驗證時,可以生成和驗證JWT,並在高級用法中包含用戶角色和權限信息。 4.常見錯誤包括簽名驗證失敗、令牌過期和Payload過大,調試技巧包括使用調試工具和日誌記錄。 5.性能優化和最佳實踐包括使用合適的簽名算法、合理設置有效期、

字符串是由字符組成的序列,包括字母、數字和符號。本教程將學習如何使用不同的方法在PHP中計算給定字符串中元音的數量。英語中的元音是a、e、i、o、u,它們可以是大寫或小寫。 什麼是元音? 元音是代表特定語音的字母字符。英語中共有五個元音,包括大寫和小寫: a, e, i, o, u 示例 1 輸入:字符串 = "Tutorialspoint" 輸出:6 解釋 字符串 "Tutorialspoint" 中的元音是 u、o、i、a、o、i。總共有 6 個元

靜態綁定(static::)在PHP中實現晚期靜態綁定(LSB),允許在靜態上下文中引用調用類而非定義類。 1)解析過程在運行時進行,2)在繼承關係中向上查找調用類,3)可能帶來性能開銷。

PHP的魔法方法有哪些? PHP的魔法方法包括:1.\_\_construct,用於初始化對象;2.\_\_destruct,用於清理資源;3.\_\_call,處理不存在的方法調用;4.\_\_get,實現動態屬性訪問;5.\_\_set,實現動態屬性設置。這些方法在特定情況下自動調用,提升代碼的靈活性和效率。
