新站上线了,站长们不能忽略的一个网站优化环节--网站地图。
Sitemap 可以让管理员通知搜索引擎他们网站上有哪些可供抓取的网页。最简单的 Sitepmap 形式,就是 XML 文件,在其中列出网站中的网址以及关于每个网址的其他元数据(上次更新的时间、更改的频率以及相对于网站上其他网址的重要程度为何等),以便搜索引擎可以更加智能地抓取网站。
下面以Google搜索引擎为例讲解一下。
Google Sitemap协议
Google SiteMap Protocol是google自己推出的一种站点地图协议,此协议文件基于早期的robots.txt文件协议,并有所升级。在Google官方指南中指出加入了Google SiteMap文件的网站将更有利于google网页爬行机器人的爬行索引,这样将提高索引网站内容的效率和准确度。文件协议应用了简单的XML格式,一共用到6个标签,其中关键标签包括链接地址、更新时间、更新频率和索引优先权。
我们来看看Google Sitemap的XML格式以及它的6个标签是什么样子的。
下面是我用站长网站生成工具获取本站首页的sitemap.xml
<?xml version="1.0" encoding="UTF-8" ?> - <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> - <url> <loc>http://www.w3note.com</loc> <!--更新频率daily --> <lastmod>2012-09-14</lastmod> <!--该页面的最后更新时间 --> <changefreq>daily</changefreq> <!--更新频率daily --> <priority>0.6</priority> <!--告诉搜索引擎抓取的优先级,数字越大,优先级越高--> </url> </urlset>
xml标签节点的意义:
大于号 > > >
小于号
年:YYYY(2005)
年和月:YYYY-MM(2005-06)
年月日:YYYY-MM-DD(2005-06-04)
年月日小时分钟:YYYY-MM-DDThh:mmTZD(2005-06-04T10:37+08:00)
年月日小时分钟秒:YYYY-MM-DDThh:mmTZD(2005-06-04T10:37:30+08:00)
这里需注意的是TZD,TZD指定就是本地时间区域标记,中国是+08:00