技术SEO

URL参数对谷歌SEO的影响

  作者:Li Bai    

URL 参数对 SEO 的影响

URL 参数是 URL 结构的组成部分。尽管它们是经验丰富的 SEO 专业人员手中的宝贵资产,但查询字符串通常会给您的网站排名带来严峻挑战。

在本指南中,您将找到在使用 URL 参数时需要注意的最常见的 SEO 问题。

什么是网址参数? 

URL 参数(也称为“查询字符串”或“URL 查询参数”)是插入到 URL 中的元素,可帮助您过滤和组织内容或跟踪网站上的信息。

简而言之,URL 参数是一种使用 URL 本身传递有关点击的信息的方法。

要标识 URL 参数,请参考 URL 中问号 (?) 之后的部分。URL 参数由键和值组成,用等号 (=) 分隔。然后,多个参数每个都用与号 (&) 分隔。

带有参数的 URL 字符串如下所示:

 https//www.domain.com/page?key1=value1&key2=value2 

<img alt="img-semblog" class="zooming lazyloaded" data-src="https://static.semrush.com/cdn-cgi/image/width=1010/blog/uploads/media/00/6e/006eebc38b54220916caecfc80fed202/Guide-to-URL-Parameters-2.png" data-gtm-vis-has-fired-9025619_57="1" src="https://static.semrush.com/cdn-cgi/image/width=1010/blog/uploads/m…a/00/6e/006eebc…/Guide-to-URL-Parameters-2.png">

Key1:第一个变量名
Key2:第二个变量名
Value1:第一个属性值
Value2:第二个属性值
? : 查询字符串开始
= : 值分隔符
& : 参数分隔符

如何使用 URL 参数(附示例)

URL 参数通常用于对页面上的内容进行排序,使用户可以更轻松地浏览在线商店中的产品。这些查询字符串允许用户根据特定过滤器对页面进行排序,并且每页仅查看一定数量的项目。

跟踪参数的查询字符串同样常见。数字营销人员经常使用它们来监控流量来自何处,因此他们可以确定他们在社交、广告活动或时事通讯方面的最新投资是否成功。

URL 参数如何工作? 

根据 Google Developers 的说法,有两种类型的 URL 参数:

1. Content-modifying parameters (active): 修改页面显示内容的参数

  • 例如,将用户直接发送到名为“xyz”的特定产品

http://domain.com?productid=xyz

2.用于高级跟踪的跟踪参数(被动):这些参数将传递有关点击的信息——即它来自哪个网络、哪个活动或广告组等——但不会改变页面上的内容。 

此信息将清楚地记录在跟踪模板中,并将包含有价值的数据,供您评估最近的营销投资。

  • 例如从您的时事通讯跟踪流量 

https://www.domain.com/?utm_source=newsletter&utm_medium=email

  • 例如,使用自定义 URL 收集活动数据

https://www.domain.com/?utm_source=twitter&utm_medium=tweet&utm_campaign=summer-sale

管理起来似乎相当简单,但有正确和错误的 URL 参数使用方式,我们将在一些示例后不久讨论。

URL 查询字符串示例

URL 参数的常见用途包括:

URL 参数何时成为 SEO 问题?

大多数 SEO 友好的URL 结构建议建议尽可能远离 URL 参数。这是因为无论 URL 参数多么有用,它们往往会减慢网络爬虫的速度,因为它们会消耗大量的爬网预算。

结构不良、不更改页面内容的被动 URL 参数(例如会话 ID、UTM 代码和附属 ID)有可能创建具有非唯一内容的无穷无尽的 URL。 

由 URL 参数引起的最常见的 SEO 问题是:

1. 重复内容:由于搜索引擎将每个 URL 视为一个独立页面,因此 URL 参数创建的同一页面的多个版本可能会被视为重复内容。这是因为根据 URL 参数重新排序的页面通常与原始页面非常相似,而某些参数可能返回与原始页面完全相同的内容。

2. 抓取预算损失:保持简单的 URL 结构是 URL 优化基础的一部分。具有多个参数的复杂 URL 会创建许多指向相同(或相似)内容的不同 URL。根据 Google Developers 的说法,抓取工具可能会决定避免“浪费”带宽来索引网站上的所有内容,将其标记为低质量并转移到下一个。 

3. 关键字蚕食:原始 URL 的过滤版本针对相同的关键字组。这会导致各个页面竞争相同的排名,这可能会导致爬虫决定过滤后的页面不会为用户增加任何实际价值。

4. 稀释的排名信号:由于多个 URL 指向相同的内容,链接和社交分享可能指向页面的任何参数化版本。这会进一步混淆爬虫,他们不知道哪个竞争页面应该为搜索查询排名。

5. URL可读性差:在优化URL结构时,我们希望URL简单易懂。一长串代码和数字几乎不符合要求。用户实际上无法读取参数化 URL。当显示在 SERP 或时事通讯或社交媒体上时,参数化的 URL 看起来是垃圾邮件和不可信的,使用户不太可能点击和共享页面。

如何管理好 SEO 的 URL 参数

大多数上述 SEO 问题都指向一个主要原因:抓取所有参数化 URL 并将其编入索引。但值得庆幸的是,对于通过参数无休止地创建新 URL,网站管理员并非无能为力。

在良好的 URL 参数处理的核心,我们找到了适当的标记。

请注意:当包含参数的 URL 显示重复的、非唯一的内容(即由被动 URL 参数生成的内容)时,会出现 SEO 问题。这些链接——只有这些链接——不应被编入索引。

检查您的抓取预算 

您的抓取预算是机器人在继续下一个页面之前将在您的网站上抓取的页面数量。每个网站都有不同的抓取预算,您应该始终确保您的抓取预算不会被浪费。

不幸的是,拥有许多可抓取的低价值 URL——例如从分面导航创建的参数化 URL——是对抓取预算的浪费。

一致的内部链接

如果您的网站有许多基于参数的 URL,那么向抓取工具发送信号通知哪些页面不要编入索引,并始终链接到静态、非参数化页面,这一点很重要。 

例如,以下是来自在线鞋店的一些参数化 URL: 

在这种情况下,请小心并始终只链接到静态页面,而不要链接到带有参数的版本。通过这种方式,您将避免向搜索引擎发送关于要索引的页面版本的不一致信号。

规范化 URL 的一个版本 

一旦您决定应该索引哪个静态页面,请记住对其进行规范化。在参数化 URL 上设置规范标签,引用首选 URL。 

如果您创建参数来帮助用户浏览您的鞋类网店登录页面,则所有 URL 变体都应包含将主登录页面标识为规范页面的规范标签。例如:

  • /鞋子/女鞋/
  • /shoes/women-shoes?color=blue
  • /shoes/women-shoes?type=high-heels

在这种情况下,上面的三个 URL 与非参数化的女鞋着陆页“相关”。这将向抓取工具发送一个信号,即只有主着陆页会被编入索引,而不是参数化的 URL。 

通过 Disallow 阻止爬虫

用于排序和过滤的 URL 参数可能会创建具有非唯一内容的无尽 URL。您可以选择使用禁止标记来阻止爬虫访问您网站的这些部分。

阻止抓取工具(如 Googlebot)抓取参数化的重复内容意味着控制它们可以通过robots.txt访问您网站上的内容。robots.txt 文件在抓取网站之前由机器人检查,因此在优化参数化 URL 时是一个很好的起点。 

以下 robots.txt 文件将禁止任何带有问号的 URL:

禁止:/*?tag=*

此禁止标记将阻止搜索引擎抓取所有 URL 参数。在选择此选项之前,请确保 URL 结构的其他部分没有使用参数,否则这些参数也会被阻止。

您可能需要自己进行爬网以找到所有包含问号 (?) 的 URL。

将 URL 参数移动到静态 URL

这属于关于动态和静态 URL的更广泛讨论。将动态页面重写为静态页面可以改善网站的 URL 结构。

但是,特别是如果参数化的 URL 当前已编入索引,您不仅应该花时间重写 URL,还应该花时间将这些页面重定向到它们相应的新静态位置。 

Google Developers 还建议: 

  • 删除不必要的参数,但保持一个动态的 URL
  • 创建等同于原始动态内容的静态内容
  • 将动态/静态重写限制为可以帮助您删除不必要参数的重写。

将 URL 参数纳入您的 SEO 策略

参数化 URL 可以更轻松地修改或跟踪内容,因此值得在需要时合并它们。您需要让网络爬虫知道何时使用参数索引特定 URL,何时不索引,并突出显示最有价值的页面版本。 

花点时间决定哪些参数化 URL 不应该被编入索引。随着时间的推移,网络爬虫将更好地了解如何导航和评估您网站的页面。

发表评论

您的电子邮箱地址不会被公开。