技术SEO

xml和html站点地图示例(sitemap):不同类型的站点地图

  作者:Jane    
sitemap

站点地图是您的技术 SEO 策略的重要组成部分,它们使爬虫和用户都受益。在本指南中,我们将回顾不同类型的网站站点地图、以及它们的优点。

什么是站点地图?

站点地图提供有关您网站结构的信息。您将主要使用它们来帮助爬虫和用户浏览您的网站。 

站点地图以 XML(可扩展标记语言)或 HTML 格式提供。XML 文件以搜索引擎爬虫能够理解的语言共享有关您网站的重要信息,例如其内部链接、反向链接和页面结构。

这些搜索引擎爬虫(如 Google 的机器人)在决定您网站的页面权限和在其 SERP 上的排名时会考虑这些数据。

为什么站点地图很重要?

站点地图向搜索机器人表明您网站的哪些元素是重要的。机器人可以使用您的 XML 站点地图来更好地了解您网站的网页如何相互链接以及您的网站的总体结构。

搜索引擎还使用您的 XML 站点地图来抓取您网站的内容和任何托管文件(如图像或视频)。搜索引擎了解您的网站越多,您获得正确关键字排名的机会就越大。

用户使用 HTML 站点地图来深入探索您的站点。您的 HTML 站点地图通常包含您网站上最重要的页面。

不同种类的站点地图

有两种常用的站点地图:XML 和 HTML。 

虽然它们具有相似的功能,但有一些重要的区别。SEO 专业人士在他们的策略中同时利用这两者来定位搜索引擎爬虫和用户是很常见的。 

XML 站点地图

XML 站点地图是为搜索引擎机器人而不是用户编写的。您将使用 XML 站点地图来共享您网站的技术细节,例如您拥有的页面数量和更新频率。

当您的网站发生变化时,您会希望与搜索引擎进行交流。新的或更新的内容向搜索引擎机器人发出信号,表明您的内容可能相关或有用,并且您更有可能成为您所在领域或领域的权威。 

HTML 站点地图

HTML 站点地图类似于 XML 文件,因为它们详细说明了您网站上可用的页面和链接。搜索引擎机器人可以抓取您的 HTML 站点地图,并使用它们向 Google 发送强烈的用户体验信号。 

然而,作为一个 HTML 文件,用户可以在他们的浏览器中打开这种站点地图。您的 HTML 站点地图应包含帮助用户浏览您网站的链接。

XML 站点地图和 HTML 站点地图有什么区别?

XML 站点地图是为搜索机器人抓取而编写的。 

您的网站上提供 HTML 站点地图供用户浏览。您通常可以在网站的页脚中找到 HTML 站点地图来帮助您导航。

XML 站点地图示例

<img alt="c9tTCNoQ_aNiQXGjK84NA_2OP8eRI3tNo7HpuWhpYGGP6AEAvbkcz4HZz1rjl7KwFci5MDQBe5snEExpCizwQb8ZPieuOLZyYTiLNeI_F8H1vNxdIGzLJ7vlzlvlz" class="zooming lazyloaded" data-src="https://static.semrush.com/cdn-cgi/image/width=1010/blog/uploads/media/47/3a/473ae1ede16491d2ff1aa0d0161a3ddb/c9tTCNoQ_aNiQXGjK84NA_2OP8eRI3tNo7HpuWhpYGGP6AEAvbkcz4HZz1rjl7KwFci5MDQBe5snEExpCizwQb8ZPieuOLZyYTiLNeI_F8H1vNxdIGzLJ7vlZbtgLz8OCvhLlr_Y.png" data-gtm-vis-has-fired-9025619_57="1" src="https://static.semrush.com/cdn-cgi/image/width=1010/blog/uploads/m…i5MDQBe5snEExpCizwQb8ZPieuOLZyYTiLNeI_F8H1vNxdIGzLJ7vlZbtgLz8OCvhLlr_Y.png">

HTML 站点地图示例

<img alt="aEEG1Y9VBdDR3RtbJWzbhEpUEXCfp6DTZpJBqOkbZKI2UrD2An8Dk7ieUNvTmAJeMsTUTmpZvEYL4NeY81EzGNzsrM4GMfqc6I4ij_BRYTY2p4d1BqOkbZKI2UrD2An8Dk7ieUNvTmAJeMsTUTmpZvEYL4NeY81EzGNzsrM4GMfqc6I4ij_BRYTY2p4d1BqOkbz6trl" class="zooming lazyloaded" data-src="https://static.semrush.com/cdn-cgi/image/width=1010/blog/uploads/media/c2/f5/c2f53d9f3885a3e73c146366b273c67b/aEEG1Y9VBdDR3RtbJWzbhEpUEXCfp6DTZpJBqOkbZKI2UrD2An8Dk7ieUNvTmAJeMsTUTmpZvEYL4NeY81EzGNzsrM4GMfqc6I4ij_BrYTY2p4d5gpUZ61BkG3Iim-hNF0trf4c0.png" data-gtm-vis-has-fired-9025619_57="1" src="https://static.semrush.com/cdn-cgi/image/width=1010/blog/uploads/m…TUTmpZvEYL4NeY81EzGNzsrM4GMfqc6I4ij_BrYTY2p4d5gpUZ61BkG3Iim-hNF0trf4c0.png">

站点地图最佳实践

如果您想帮助 Google 索引您的网站,站点地图是必不可少的。尽管您的站点地图看起来可能与您的竞争对手有所不同,但在创建自己的地图时需要考虑一些常见的最佳实践。

您可以在设置站点地图时使用站点审核工具以确保其配置正确。该工具包括 120 多项页面和技术 SEO 检查,这些检查突出显示了诸如断开的链接、孤立的页面和其他阻止爬网机器人将您的网站编入索引的障碍等问题。

其他最佳实践包括:

包括优先页面

您可以为站点地图中的页面分配 <priority> 标记。此标记向 Google 表明您认为该网页很重要。 

优先级设置的间隔为 0.0、0.1、0.2 等,一直到 1.0。最高优先级页面设置为 1.0。如果所有页面都设置为相同的优先级,Google 将无法判断哪些页面实际上很重要。确保您正确标记页面。

改变频率

您可以在 XML 站点地图中设置 <changefreq> 标记,以告诉 Google 页面将多久更新一次新内容。此标签仅指代码或文本,而非图像。

您可以使用 7 个 change freq 标签:

  • 从不:此页面上的内容是静态的,不会更改。您可以将此标签用于新闻文章、新闻稿和类似内容。 
  • 每年:如果您有年度活动、销售或报告,请使用此标签。
  • 每月:此标签可能最适合常见问题页面、月度报告或每月仅更新一次的博客。
  • 每周:您可以将此标签用于产品页面、每周更新的博客页面或“每周回顾”新闻简报。
  • 每日:此标签最适合新闻页面、留言板和博客文章。
  • 每小时:主要新闻网站将此标签用于天气更新等内容。  
  • 始终:此标签是股票市场页面、Twitter 提要页面以及不断刷新的类似 Web 内容。 

避免无索引页面

当您向 Google 提交站点地图时,您要求对您的站点进行抓取和索引。如果您的页面标记为“noindex”,则不应将其提交到站点地图文件中。

避免重复的内容

有时您为了存档目的而保留重复的内容;例如,如果您更新了文档,则可能会转到文档的先前版本。 但是,Google 会对重复内容进行处罚,因此您应该将重复页面设置为“noindex”。

使用多个站点地图

如果您有一个大型网站,您的站点地图可能会变得太大而无法上传。站点地图文件最大应为 50mb 或不超过 50,000 个 URL。

在这种情况下,拥有多个站点地图可能是个好主意。即使您接近这个数字,将您的文件拆分为多个 XML 站点地图也是一个好主意,这样您就可以加快抓取过程。

大型电子商务网站也可以从为不同类别和产品页面开发站点地图中受益。

关键要点

站点地图可以搜索引擎和用户浏览您的网站。无论哪种方式,它们都是有用的文件。

您可以根据需要更改和更改站点地图。当您这样做时,请重新上传您的站点地图,以便 Google 始终抓取您最新的内容。

网站审核可帮助您发现任何可能影响网站可抓取性的网站错误。持续运行站点审核以检查这些错误,并在将站点地图提交给搜索引擎之前解决它们。