图片来自海投网底部的技术支持,这个应该是华科开发的,基于PHP,专门抓取各高校招聘网站的信息,页面应该是php生成的伪静态页面。请问,这个是如何控制更新的频率的,是自动更新还是手动更新?PHP可以自动抓取页面并生成伪静态页面吗?这个网站大概如何实现?实现上有哪些技术难点?
回复内容:
web 开发方面没有 php 做不到的事情,顶多是适合与不太适合。
有人关注感觉还是有点小激动呀。。。是基于PHP的,更新频率当然是能够满足你不会让你错过宣讲会的啦。
自动还是手动的话反正在你看来绝对是自动更新的,绝对不会让你手动去更新今天的信息的。好吧。。。好像没回答题主的问题,不过我又不是团队中的格力,可以掌握核心科技,也回答不了,所以想了解具体的还是欢迎来加入我们~
至于很多人吐槽的界面问题,那个,其实我们一开始完全没想做商业项目啊,只是懒得到处去找,想着找个地方把宣讲会信息聚一块看多爽快。然后就开始到处搜集,搜集就出现人开始防,然后就激起了你的破防欲,然后就一个一个的攻城游戏让你欲罢不能,然后搜集着搜集着发现点击量慢慢上去了,就发现其实很多人想像这样聚一块看。。。然后才发现给人看我们以前自己用的纸张有点不合适呀。。。
所以华丽小清新新界面很快就会出现,而那种大块吃肉,大片看信息的爽快感依旧~,很多不成熟正在慢慢改变,The world is often unkind to new talent, new creations. The new needs friends.脱生于校园,只是希望比园外更懂你,希望大家继续多多支持~宣讲会查询系统
这个我知道 他们团队有50多个人 手动更新的
所谓“自动”和“频率”,主要还是看业务需求吧。
你说的这个系统我没关注过,不过只要定义了抓取源,要实现定期执行php脚本还是有很多方法的,最常用的就是系统的计划任务了,毕竟php写后台常驻进程的功能风险还是比较大的。
我看这儿应用本身对数据的有效性要求还是比较高的,我觉得频率应该比较高,这就要依托服务器的硬件和网络了。
我来个正解吧。
先是自动的,信息量很大。人工会筛掉一些不符合质量的,或者说不符合海投辐射范围的。
就酱。
别问我为什么知道。
是自动抓取的,我负责武汉理工的就业信息网,在上面加了代码,他们就没有生成原站模式,而且他们也会经常调整抓取的方法,系统的监控应该是很不错的