首页 php教程 php手册 PHP代码实现爬虫记录超管用

PHP代码实现爬虫记录超管用

Jun 06, 2016 pm 07:49 PM

这篇文章主要通过创建crawler数据库,使用robot.php记录来访的爬虫信息从而将信息插入数据库,从而使用php代码实现爬虫记录,有需要的小伙可以来参考下。

实现爬虫记录本文从创建crawler 数据库,robot.php记录来访的爬虫从而将信息插入数据库crawler,然后从数据库中就可以获得所有的爬虫信息。实现代码具体如下:

数据库设计

create table crawler ( crawler_ID bigint() unsigned not null auto_increment primary key, crawler_category varchar() not null, crawler_date datetime not null default '-- ::', crawler_url varchar() not null, crawler_IP varchar() not null )default charset=utf;

以下文件 robot.php 记录来访的爬虫,,并将信息写入数据库:

-) { $Bot = "Other Crawler"; } if (strpos($agent,"googlebot")>-) { $Bot = "Google"; } if (strpos($agent,"mediapartners-google")>-) { $Bot = "Google Adsense"; } if (strpos($agent,"baiduspider")>-) { $Bot = "Baidu"; } if (strpos($agent,"sogou spider")>-) { $Bot = "Sogou"; } if (strpos($agent,"yahoo")>-) { $Bot = "Yahoo!"; } if (strpos($agent,"msn")>-) { $Bot = "MSN"; } if (strpos($agent,"ia_archiver")>-) { $Bot = "Alexa"; } if (strpos($agent,"iaarchiver")>-) { $Bot = "Alexa"; } if (strpos($agent,"sohu")>-) { $Bot = "Sohu"; } if (strpos($agent,"sqworm")>-) { $Bot = "AOL"; } if (strpos($agent,"yodaoBot")>-) { $Bot = "Yodao"; } if (strpos($agent,"iaskspider")>-) { $Bot = "Iask"; } require("./dbinfo.php"); date_default_timezone_set('PRC'); $shijian=date("Y-m-d h:i:s", time()); // 连接到 MySQL 服务器 $connection = mysql_connect ($host, $username, $password); if (!$connection) { die('Not connected : ' . mysql_error()); } // 设置活动的 MySQL 数据库 $db_selected = mysql_select_db($database, $connection); if (!$db_selected) { die ('Can\'t use db : ' . mysql_error()); } // 向数据库插入数据 $query = "insert into crawler (crawler_category, crawler_date, crawler_url, crawler_IP) values ('$Bot','$shijian','$GetLocationURL','$serverip')"; $result = mysql_query($query); if (!$result) { die('Invalid query: ' . mysql_error()); } ?>

成功了,现在访问数据库即可得知什么时候哪里的蜘蛛爬过你的什么页面。

view sourceprint? num_rows($mysql -> query("select * from crawler")); $pages = new PageClass($count,,$_GET['page'],$_SERVER['PHP_SELF'].'?page={page}'); $sql = "select * from crawler order by "; $sql .= "crawler_date desc limit ".$pages -> page_limit.",".$pages -> myde_size; $result = $mysql -> query($sql); ?>

fetch_array($result)){ ?>
爬虫访问时间 爬虫分类 爬虫IP 爬虫访问的URL
PHP代码实现爬虫记录超管用
myde_write(); ?>

以上代码就是PHP代码实现爬虫记录——超管用的全部内容,希望对大家有所帮助。

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热门文章

R.E.P.O.能量晶体解释及其做什么(黄色晶体)
2 周前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳图形设置
2 周前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您听不到任何人,如何修复音频
3 周前 By 尊渡假赌尊渡假赌尊渡假赌

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)