VMRack

广告

安信SSL证书

广告

Google权威链接(Canonical)判定标准:九大核心场景解析

美国云服务器推荐

“Canonical URL”(URL规范化)指被公认具有权威性的链接,在SEO行业的含义是:当多个页面内容相同或高度相似时,哪个URL才是真正的“主页面”。但有时Google会选择“看似错误”的链接作为权威链接,究竟是怎么一回事?下文九大场景看懂Google如何确定页面权威链接(来自官方人员解释)。

通常情况下,网站管理员和SEO从业者可以通过HTML中的rel=canonical属性向Google建议首选URL。很多人习惯把它称作一个“HTML标签”,其实并不准确:rel=canonical是<link>标签的一个属性,而非独立标签。简单理解:HTML标签是网页的结构模块,属性则是用来修饰、配置这些模块的标记。

Google为何会选这个URL当权威链接?

例如为什么Google会认为两个主题并不完全一样的页面是重复内容,还选了其中一个当权威页?Google的John Mueller对此给出了大约9种具体原因,既包括技术层面的判定依据,也解释了为什么有时Google看似“选错了”,实则是网站方或SEO忽略了某些细节。

1、内容完全重复两个页面完全一模一样,没有任何可区分的有效信号,Google只能任选其一。

2、主体内容高度重复页面核心内容大面积重叠,比如同一篇文章被发布在多个栏目或多个站点下。

3、独立内容太少,模板占比过高页面真正独有的内容极少,导航、菜单、布局等重复模块占主导,导致页面看起来几乎一样。

4、URL参数模式被判定为重复如果Google发现带不同参数的URL实际返回相同内容,就会把同类参数链接都判定为重复。

5、以移动端页面作为判断依据Google可能用移动版页面做重复判断,而人们通常只在电脑端检查,因此会出现判断差异。

6、以Googlebot实际抓取到的版本为准权威链接判定基于爬虫真正获取到的内容,不一定等于用户在浏览器看到的版本。

7、给Googlebot返回了替代页面或非内容页如果网站对Googlebot出示了验证页面、伪错误页等通用内容,这些页面可能因内容相似被判定重复。

8、JavaScript内容无法正常渲染当Google无法渲染页面时,只能基于基础HTML骨架判断,而这类骨架往往全站通用,容易被判重复。

9、系统识别模糊或误分类某些情况下,某个URL只是因为“看起来位置不对”,或系统对相似度识别存在局限,而被误判为重复。

John Mueller表示,目前并没有工具能直接告诉你为什么某页面被判定为重复。多年下来,资深从业者会慢慢形成经验,但很多情况依然不直观。他总结的重复内容判定原因主要包括:

  • 完全重复(所有内容一致)
  • 部分重复(核心内容大面积重叠)
  • 有效内容过少(模板过大、正文过小)
  • 根据URL参数模式推断重复(容易多参数混淆出错)

另外,两个最容易让人困惑的原因是:

  • Google使用移动版页面做判断(而人们习惯查桌面版)
  • Google以爬虫实际看到的版本为准(如果给爬虫返回验证页、错误页,极易被判重复)

同时,对于JS渲染的站点,如果页面无法正常渲染,Google只能使用空壳HTML,也几乎一定会被判重复。

总之,Google选择权威链接的过程,本质上是一套多信号叠加的模糊匹配系统。过程中会综合对比页面内容、URL结构、渲染后的实际输出、爬虫可见版本等。对于边界模糊、不影响用户体验的“奇怪判定”,Google通常不会做严苛处理,因此大部分误判并不会导致严重惩罚。

更多参考:

网址规范化(Canonical URL)入门到精通

Google网站排名下降的8个易被忽视的原因​

技术SEO优化的8大核心要点

(本文由美国主机侦探原创,转载请注明出处“美国主机侦探”和原文地址!)

主机侦探企业微信

微信扫码加好友进群

主机优惠码及时掌握

主机侦探QQ群

QQ群号:164393063

主机优惠发布与交流

温馨提示:

1、本站部分图片来源于互联网,如有侵权请联系删除。邮箱:2942802716#qq.com(#改为@)

2、本文评论没有专人回复,如果您有问题请到美国主机侦探论坛提问!

3、美国主机侦探免费为您提供美国主机购买咨询。

RAKsmart美国服务器
下一篇
Google权威链接
已经没有了
返回顶部