所以从技术角度来说,百度能否跟踪记录某个用户从第一次打开segmentfault网站,到最后离开的所有浏览记录呢?
如果可以的话,怎么实现呢?
条件:不放js代码
比如:
搜索关键词:微信开放平台问答
接着我继续浏览网页……
首先,从百度搜索结果中点击第一条记录的时候,是需要访问百度服务器的,所以百度肯定可以记录到,但是一旦进入了:SF的微信开放平台页面,此时应该不在百度的控制范围以内了吧?
但是,作为中国搜索引擎的老大,肯定需要对用户行为进行分析的吧,如果网站没有使用百度提供的js的话,单纯使用爬虫技术能否实现呢?如果不能的话,需要配合什么技术来实现?
如果sf的官网放一段百度提供的js代码是可以实现的。这应该和QQAnalysis或者GoogleAnalytics一样的原理。可以分析用户的一些数据。
个人感觉不行,ga和百度统计通过页面标签技术使用cookie追踪访客,只有放置了js代码才可以。
还有一种方法是百度能够读到网站日志
1, 搜索引擎肯定是无法直接统计你在第三方网站的行为的。
2, 搜索引擎对你行为的分析,或者说,对第三方网站质量的判断,是基于庞大的、与时俱进的算法。但是基础也就包括你点击搜索结果的频率,对你个人而言这不代表什么,但是海量用户,点击某个关键词的数量,与其排名不符时,显然需要调整这个结果的排名了。
其它的就是那些 seo 的老一套, html 规范、 站点稳定性速度、 外部链接和贵站是否有自造词、 自造词的流行程度、站点内容更新频率和质量、内容价值是否高等等。
对了,搜索引擎一般养着广告联盟和统计服务, 这能在有限角度上,提升引擎对第三方站点用户行为的监控,但我个人认为影响有限。
想一下http回话是怎么识别一个用户的?爬虫爬的时候发起的是他自己的回话,不可能抓取到你和segmentfault的回话内容,所以无法追踪到你们的回话过程。爬虫是来抓去静态内容的。
如果不放JS,那么大概只有你的浏览器工具栏里面有百度的某些插件,那么就可以统计到了。
如果只用了百度搜索,并不使用百度的其它软件、网站也不用百度统计或分享,估计是不能追踪的。。。但从技术上来说,是可以实现的。。。
各家在互联网上,基于协议对话和协作。协议层面,不能。
互联网讲究的是分治。即使是DNS,也没有统一的机构管理。因此,你要看到别人的东西,必须对方合作。
基于合作,方法就多了:
1. 公开web log
2. 放置js
基于偷鸡摸狗,方法也不少:
1. 肉鸡。。。。
2. 流氓工具条
3. dns污染
你这样为百度谋划,你有想过SF等网站的感受吗。