以前看到别人网站上的内容都是每天自动更新的,觉得这种技术很神奇。
也一直在琢磨为什么他们网站不大,也不可能有自己的天气预报预测中心吧,
但是天气预报每天都是自动更新的,然后从别人那里得知,那是因为有小偷程序这种东西的存在~
小偷程序说的好听点就是采集程序,采集别人网站上的信息到自己的网站上。
采集程序的原理就是用正则表达式匹配和替换从别的网站上读取出来的内容,然后显示到自己的网站上。
下面来说说我用php正则表达式实现的一个天气预报的小偷程序吧。
目标站点:**天气预报网
原因:代码不是很多,比较容易查找相关内容做截取定位
实现步骤:
①读取问天网网页内容带字符串
使用php函数$str=file_get_contents("url");读取目标站点网页内容并赋值给$str变量
②通过正则表达式函数eregi匹配出需要的内容
eregi("正则表达式","匹配的字符串$str","返回值");
③查找和替换一些内容
使用$str2=str_replace("被替换的字串","替换成的字串","原字符串");
使用字符串替换函数在这里的作用是替换掉天气预报状态的图片的路径,使得图片可以正常显示
④输出结果到网页中
echo $str2;
ok~到此一个简单的小偷程序就完成了。
下面为最终效果截图: