Sitemap 可方便管理员通知搜索引擎他们网站上有哪些可供抓取的网页。最简单的 Sitepmap 形式,就是 XML 文件,在其中列出网站中的网址以及关于每个网址的其他元数据(上次更新的时间、更改的频率以及相对于网站上其他网址的重要程度为何等),以便搜索引擎可以更加智能地抓取网站。
Sitemap 会提供此数据以便允许支持 Sitemap 的抓取工具抓取 Sitemap 提供的所有网址,并了解使用相关元数据的网址。使用 Sitemap 协议并不能保证网页会包含在搜索引擎中,但可向网络抓取工具提供一些提示以便它们更有效地抓取网站。
百度sitemap的使用方法
第一步:添加网站,验证网站归属,等待审核
登录后点击“添加网站”。若网站删除或更换域名,则需重新提交。
点击“验证此网站”,选择验证方式并获取验证文件,完成验证。
验证方式一:文件验证
验证方式二:HTML标签验证
等待管理员审核。主要审核网站属性、网站内容质量等。审核最长可能需要一天时间。
第二步:通过点击“数据管理”,添加新数据
如何添加新数据
选择数据的类型,根据类型对应的xml格式规范部署您的数据文件。
为您的数据指定更新周期。
按照xml格式规范部署好文件后,在地址栏填写文件存放地址,点击提交即可。
我们对文件的处理时间长短将视文件大小而定。
如何手动更新已提交的数据
如果您想在指定更新周期以外,手动通知我们数据有更新,可以在“数据管理”页面选中要手动更新的文件并点击“更新所选”即可。
如果数据存在错误或不符合协议格式,则状态栏会显示为错误,请参考平台提示修改并更新。
您可通过平台查看数据的统计信息,包括已抓取数量,最新处理时间等。
注:百度对已提交的数据,不保证一定会抓取及索引所有网址,并且不保证其排名。
sitemap网站地图注意要点
1、全部链接真实有效
地图的主要目的是方便搜索引擎蜘蛛抓取的,如果地图存在死链或坏链,会影响网站在搜索引擎中网站权重的,所以要仔细检查有无错误的链接地址,提交前通过站长工具,检查网站的链接是否有效。
2、简化网站地图
网站地图不要出现重复的链接,要采用标准W3格式的地图文件,布局要简洁,清晰,如果地图是内容式地图,每页不要超过100内容个链接,采用分页的行式,逐一开来,这样方便搜索引擎蜘蛛逐页爬行。
3、更新网站地图
建议经常更新网站地图,经常的更新地图,便于培养搜索引擎蜘蛛爬行的粘度。经常有新的地图内容生成,长期以来,蜘蛛就会更关注,培养蜘蛛的爬行规则,这样网站内容能更快的被搜索引擎抓取收录。