科普知识:
Sitemap 可方便管理员通知搜索引擎他们网站上有哪些可供抓取的网页。最简单的 Sitepmap 形式,就是 XML 文件,在其中列出网站中的网址以及关于每个网址的其他元数据(上次更新的时间、更改的频率以及相对于网站上其他网址的重要程度为何等),以便搜索引擎可以更加智能地抓取网站。
网络抓取工具通常会通过网站内部和其他网站上的链接查找网页。Sitemap 会提供此数据以便允许支持 Sitemap 的抓取工具抓取 Sitemap 提供的所有网址,并了解使用相关元数据的网址。使用 Sitemap 协议并不能保证网页会包含在搜索引擎中,但可向网络抓取工具提供一些提示以便它们更有效地抓取网站。
Sitemap 0.90 是依据创意公用授权-相同方式共享 (Attribution-ShareAlike Creative Commons License) 的条款提供的,并被广泛采用,受 Google、Yahoo! 和 Microsoft 在内的众多厂商的支持。
=======
下面这个网址,可以帮助你分析sitemap
http://www.xml-sitemaps.com
注意的是入口网址应该填真实网址(比如我的首页是一个Flash,该网站就无法抓紧),否则分析会出错。
但有500页面的限制,这个有点不太好。
这是我博客的站点地图:http://www.dreamflier.net/sitemap.xml
还有一个软件支持分析,但需要netframworks框架支持:
http://www.sitemapbuilder.net/downloads/SiteMapBuilder.zip
效果今天试了,还不错,能全面抓取并进行分析,有3维的图片分析,挺好!速度也挺快。
======
服务:博主可以为大家生成完整的sitemap,有需要的,请回贴留言你的网址和邮箱。我会尽快生成并发给你。