Manuel de documentation MIP / MIP Cache 规范

MIP Cache 规范

百度MIP-Cache给所有符合规范的MIP页面提供cache服务,能够主动的提高页面加载速度,为使用 MIP-Cache 服务的页面上的图片、CSS文件等资源提供缓存服务,这样能做到所有HTTP请求来自于同源,能够加速加载速度。

使用方法

在开发页面时,无需对 MIP Cache 进行额外关注,只要保证MIP页面、图片等资源是允许MIP cache的UA(baidumip, baidumib)抓取即可。

在引用图片等静态资源时,无论是否支持https,直接引用本站服务器上的图片即可。如使用:<mip-img src="http://www.baidu.com/logo.png">

MIP-Cache 生效流程

在 MIP 页被爬虫抓取后,会自动对静态资源的进行缓存,并且替换页面中的静态资源引用地址为缓存地址。搜索结果页会优先跳转到MIP-Cache url,在MIP-Cache缓存到期时进行一次回源,访问原页面 URL 并重新缓存。

缓存后的页面都是https的,安全性更高。

了解MIP cache的url规则

url规则和下列情况有关:

内容类型:图片、MIP页面等,图片使用'/i',其他使用'/c'

协议类型:使用TLS,https的增加'/s',http的不加

例如:

1、网页地址或css、js https资源:

originalUrl:https://www.mipengine.org/

cdnMipUrl:https://mipcache.bdstatic.com/c/s/www.mipengine.org

http资源:

originalUrl:http://m.example.com/

cdnMipUrl:https://mipcache.bdstatic.com/c/m.example.org

2、图片 https资源:

originalUrl:https://www.mipengine.org/static/img/banner_wise_3f04050.jpg 

cdnMipUrl:https://mipcache.bdstatic.com/i/s/www.mipengine.org/static/img/banner_wise_3f04050.jpg

http资源:

originalUrl:http://www.sinaimg.cn/dy/slidenews/1_img/2016_25/2841_703424_763161.jpg

cdnMipUrl:https://mipcache.bdstatic.com/i/www.sinaimg.cn/dy/slidenews/1_img/2016_25/2841_703424_763161.jpg

页面编码要求

强制使用UTF-8编码

MIP Cache 更新机制

MIP Cache 常规更新机制

MIP Cache 常规更新机制也是页面最常规,最常用的更新机制。目前页面更新周期52分钟,当用户访问 MIP 页面时,如果页面缓存已经超时,MIP Cache 会将当前页面返回给用户;与此同时,异步的发起一个请求,去更新 MIP Cache 中存储的页面。这样,后续访问这个页面的用户将会看到更新后的页面。目前,线上页面更新的平均时间(可以理解为有点击的间隔时间)为1天左右。目前抓取限制比较多的站点,更新的时效性无法保证,也请相关站长保证自己网站,服务的稳定性。

MIP Cache 快速更新机制

考虑到一些特殊情况,需要尽快更新 MIP Cache 中的页面。比如线上 BUG 紧急修复、发现网页有黄反等需要紧急更新或者删除的内容时,MIP Cache 也开放了单独的清理接口,阅读MIP-cache清理了解更多信息。生效时间大概5min

MIP Cache 页面删除

如果有一些废弃页面需要删除:

  • 站长首先删除本站原页面
  • 调用 MIP Cache 快速更新机制删除 Cache
  • 删除后,请给 MIP Cache 非200(404或者其他)状态码,防止cache中缓存错误页。

添加预取标签

待扩展

<link href="***" rel="dns-prefetch">