规范标签:初学者的简单指南
想要了解规范标签是什么,以及如何使用它们来避免可怕的重复内容问题?
规范标签并不新鲜。它们自2009年以来一直存在,十年来最好的部分。
百度,360和搜狗联合创建它们。他们的目标?为网站所有者提供快速,轻松地解决重复内容问题的方法。
做他们的工作?是的,完美……但只有你知道如何使用它们!
在本指南中,您将学习:
什么是规范的标签
一个规范的标签是什么样的
为什么规范标签对SEO很重要
如何实现规范标签
如何避免常见的规范化错误
如何修复规范化问题
什么是规范标签?
规范标记是HTML代码片段,用于定义重复,近似重复和类似页面的主要版本。换句话说,如果您在不同的URL下具有相同或相似的内容,则可以使用规范标记指定哪个版本是主要版本,因此应该编制索引。
规范标签是什么样的?
规范标签使用简单一致的语法,并放置在网页的
https://paimingdiyi.com/seo/” />
以下是该代码的每个部分表示的内容:
link rel =“canonical”: 此标记中的链接是此页面的主(规范)版本。
href =“https://paimingdiyi.com/seo/”: 可以在此URL找到规范版本。
为什么规范标签对SEO很重要?
百度不喜欢重复的内容。这让他们更难选择:
要索引的页面版本(它们只会索引一个!)
对相关查询进行排名的页面版本。
是否应该在一个页面上整合“链接权重”,或者在多个版本之间进行拆分。
过多的重复内容也会影响您的“抓取预算”。这意味着百度最终可能会浪费时间抓取同一页面的多个版本,而不是发现您网站上的其他重要内容。
关于爬行预算的真相
迫使百度浪费时间来抓取重复内容是应该尽可能避免的。
如果新页面在发布的同一天往往被抓取,则抓取预算不是网站管理员需要关注的内容。同样,如果一个站点的URL少于几千个,那么大多数时候它都会被有效地抓取。
Canonical标签解决了所有这些问题。他们让你告诉百度他们应该索引和排名的页面版本,以及巩固任何“链接权重”的位置。
未能指定规范网址,搜索引擎会自行解决问题。
如果您没有指明规范网址,我们会确定我们认为最佳版本或网址。
像这样依赖搜索引擎并不是一个好主意。他们可能会选择您不希望成为规范的页面版本。
重要说明
搜索引擎表示他们通常会尊重您设置的规范网址,但并非总是如此。
请注意,即使您明确指定了规范页面,搜索引擎也可能出于各种原因选择不同的规范,例如效果或内容。
使用规范标记最佳做法将有助于降低搜索引擎将网页的不良版本视为规范的风险。
但我没有重复的内容,是吗?
鉴于您可能没有多次发布相同的帖子和页面,很容易假设您的网站没有重复的内容。
但搜索引擎会抓取网址,而不是网页。
这意味着他们将paimingdiyi.com/seo和paimingdiyi.com/seo?color=red视为唯一页面,即使它们是具有相同或相似内容的同一网页。
这些被称为参数化URL,它们是重复内容的常见原因,尤其是在具有分面/过滤导航的电子商务网站上。
但不仅仅是电子商务网站成为重复内容的受害者。
以下是适用于所有类型网站的重复内容的一些其他常见原因:
为搜索参数设置参数化URL (例如,paimingdiyi.com?q = search- term)
为会话ID设置参数化URL(例如,https://paimingdiyi.com?alive = 3)
具有单独的可打印版本的页面 (例如,paimingdiyi.com / page 和paimingdiyi.com/print/page)
为不同类别的帖子提供唯一的URL (例如,paimingdiyi.com / services / SEO / 和paimingdiyi.com/ specials / SEO /)
拥有不同设备类型的页面 (例如,paimingdiyi.com 和m.paimingdiyi.com)
拥有页面的AMP 和非AMP版本 (例如,paimingdiyi.com / page 和amp.paimingdiyi.com / page)
在非www / www和非https / https变体 (例如,https://paimingdiyi.com 和http://www.paimingdiyi.com)上提供相同的内容
在这些情况下,正确使用规范标签至关重要。
此外,跨域重复内容问题也是一个问题。如果您正在联合内容(例如,如果报纸想要在其网站上逐字地重新发布您的内容),那么您应该要求他们为原始内容添加规范链接。
这样做可以从该出版物获得推荐流量,同时降低搜索引擎排名错误网址的风险。
有些网站可能会拒绝添加规范链接。在这种情况下,您是否想承担风险取决于您。如果你这样做,值得关注联合页面,以确保它不会超过原始页面。
规范标签实现的基础知识
Canonicals易于实现。我们将在稍后讨论四种不同的方法。但无论您选择哪种方法,都应该始终记住五条黄金法则。
规则#1:使用绝对URL
最好不要使用rel =“canonical”链接元素的相对路径。
您可以使用其中任何一个,但我建议您使用绝对URL,以确保它们被正确解释。
所以你应该使用以下结构:
https://paimingdiyi.com/seo/ ”/>
与此相反:
规则#2:使用小写URL
由于搜索引擎可能会将大写和小写网址视为两个不同的网址,因此您需要先确保在服务器上强制 使用小写网址,然后对规范标记使用小写网址。
规则#3:使用正确的域版本(HTTPS与HTTP)
如果切换到SSL,请确保未在规范标记中声明任何非SSL(即HTTP)URL。这样做理论上会导致混乱和意外结果。如果您位于安全域中,请确保使用以下版本的URL:
https://www.paimingdiyi.com/seo/ ”/>
相反:
<链路的rel =“规范” HREF =“ http://www.paimingdiyi.com/seo/” />
如果您没有使用HTTPS,那么情况正好相反。
规则#4:使用自引用规范标签
虽然不是强制性的,但建议使用自引用规范标签。
我建议[使用]自引用规范,因为它确实让我们清楚地知道您要索引哪个页面,或索引索引时的URL。
即使您有一个页面,有时会有不同的URL变体可以拉动该页面。例如,最后使用参数,可能使用大写小写或www和非www。所有这些东西都可以通过rel规范标签进行清理。
如果你不确定自引用规范是如何工作的,它基本上是一个指向自身的页面上的规范标记。例如,如果网址为https://paimingdiyi.com/seo, 则该网页上的自引用规范将为:
https://paimingdiyi.com/seo”/>
大多数现代流行的CMS都会自动添加自引用网址,但如果使用自定义CMS,则需要让开发人员对其进行硬编码。
规则#5:每页使用一个规范标记
如果该网页包含多个规范标记,则搜索引擎会忽略这两个标记。
在多次声明rel = canonical的情况下,搜索引擎可能会忽略所有rel =规范提示。
如何实现规范
有四种方法可以指定规范网址:
HTML标记(rel = canonical)
HTTP标头
网站地图
301重定向
1.使用rel =“canonical” HTML标记设置规范
使用rel = canonical标记是指定规范URL的最简单,最明显的方法。
只需将以下代码添加到任何重复页面的
部分:https://paimingdiyi.com/seo/”/>
2.在HTTP标头中设置规范
对于像PDF这样的文档,由于没有页面
例
想象一下,我们创建了此博客文章的PDF版本并将其托管在我们的博客子文件夹(paimingdiyi.com/blog/*)中。
以下是我们的HTTP标头对该文件的外观:
HTTP / 1.1 200好的
内容类型:应用 / pdf
链接:http://paimingdiyi.com/blog/canonical-tags/; 的rel = “规范” 的
3.在站点地图中设置规范
搜索引擎声明非规范页面不应包含在网站地图中。只应列出规范网址。这是因为搜索引擎将网站地图中列出的网页视为建议的规范。
但是,他们并不总是选择网站地图中的URL作为规范。
我们不保证我们会将网站地图网址视为规范,但这是为大型网站定义规范的简单方法,站点地图是告诉搜索引擎您认为哪些网站在您的网站上最重要的有用方式。
4.使用301重定向设置规范
如果要将流量从重复的URL转移到规范版本,请使用301重定向。
例
假设您的网页可以通过以下网址访问:
paimingdiyi.com
paimingdiyi.com/index.php
paimingdiyi.com/home/
选择一个URL作为规范,并重定向其他URL。
对于网站的安全HTTPS/HTTP和www/非www版本,您应该这样做。选择一个规范版本并将其他版本重定向到该版本。
例如,paimingdiyi.com的规范版本是HTTPS含有www URL(https://www.paimingdiyi.com)。所有以下网址都重定向:
http://paimingdiyi.com/
http://www.paimingdiyi.com/
https://paimingdiyi.com/
常见的规范化错误要避免
规范化是一个有点复杂的话题。因此,对于如何正确地规范化存在许多误解和误解。
以下是人们在尝试规范化时常犯的一些错误:
错误#1:通过robots.txt阻止规范化的URL
阻止robots.txt中的网址会阻止百度抓取该网址,这意味着他们无法在该网页上看到任何规范标记。反过来,这阻止了他们将任何“链接资产”从非规范转移到规范。
错误#2:将规范化URL设置为“noindex”
永远不要混合noindex和rel = canonical。他们是矛盾的指示。
搜索引擎通常会将标准标签优先于“noindex”标签。但这仍然是不好的做法。如果您想要无索引和规范化URL,请使用301重定向。否则,请使用rel = canonical。
错误#3:为规范化URL设置4XX HTTP状态代码
为规范化URL设置4XX HTTP状态代码与使用“noindex”标记具有相同的效果:百度将无法查看规范标记并将“链接权重”转移到规范版本。
错误#4:将所有分页页面规范化为根页面
不应将分页页面规范化为系列中的第一个分页页面。相反,应该在所有分页页面上使用自引用规范。
要避免的主要内容,因为这篇文章是关于规范化的,是使用第2页上指向第1页的rel = canonical。第2页不等同于第1页,所以rel = canonical就像那样不正确。
您还应该使用rel = prev / next标签进行分页。
错误#5:不使用带有hreflang的规范标签
Hreflang标签用于指定网页的语言和地理定位。
搜索引擎声明,在使用hreflang时,您应该“使用相同语言指定规范页面,或者如果同一语言不存在规范,则应使用最佳替代语言”。
如何在您的网站上修复规范化问题
通过规范化很容易出错,因此定期审核您的网站以查找与规范标签相关的问题并尽快修复它们是值得的。
以下是12个与规范标签相关的问题,以及如何解决这些问题:
1.规范指向4XX
当一个或多个页面被规范化为4XX URL时,会触发此问题。
为什么这是一个问题
搜索引擎不会索引4XX页面,因为它们不起作用。结果,他们将忽略指向这些页面的任何规范标签,并且通常最终索引错误的(非规范)版本的页面。
怎么修
查看受影响的页面,并将死(4XX)规范链接替换为您要编制索引的工作(200)页面的链接。
2.规范指向5XX
当一个或多个页面规范化为5XX URL时,会触发此问题。
为什么这是一个问题
5XX HTTP状态代码表示服务器问题,导致无法访问的规范页面。百度不太可能索引无法访问的网页,因此可能会忽略规范。
怎么修
用有效的URL替换任何错误的规范URL。如果指定的规范似乎正确,请检查服务器配置错误。请注意,如果您的网站因维护或网站服务器超载而导致网页崩溃,则可能会出现临时问题。
3.规范指向重定向
当一个或多个页面被规范化为重定向的URL时,会触发此问题。
为什么这是一个问题
规范的的应始终指向页面的最权威版本。重定向URL不是这种情况。因此,搜索引擎可能会误解或忽略规范。
怎么修
将规范链接替换为指向页面最权威版本的直接链接(即,返回200 HTTP状态代码且不重定向的版本)。
4.没有规范的重复页面
当存在一个或多个未指定规范版本的重复或非常相似的页面时,将触发此问题。
为什么这是一个问题
由于未指定规范,百度将尝试确定要在搜索结果中显示的最合适的版本。这可能不是您要索引的版本。
怎么修
查看重复组。选择一个应在搜索结果中编入索引的规范版本。将其指定为所有重复项的规范版本(并将自引用规范标记添加到规范版本)。
5.非常规的非法行为
当一个或多个页面在其hreflang注释中指定非规范URL时,将触发此问题。
为什么这是一个问题
hreflang标记中的链接应始终指向规范页面。从hreflang注释链接到页面的非规范版本可能会混淆和误导搜索引擎。
怎么修
用受规范替换受影响页面的hreflang注释中的链接。
6.规范URL没有传入的内部链接
当一个或多个指定的规范URL没有内部传入链接时,会触发此问题。
为什么这是一个问题
网站访问者无法访问没有内部链接的规范网址。在网站的某个地方,它们被定向到页面的非规范版本。
怎么修
将所有内部链接替换为规范化页面,并使用指向规范的直接链接。
7.网站地图中的非规范页面
当网站地图中列出一个或多个非规范页面时,会触发此问题。
为什么这是一个问题
搜索引擎声明您不应在站点地图中包含非规范网址。原因是,他们将站点地图中的页面视为建议的规范。您应该只列出要在站点地图中编入索引的页面。
怎么修
从您的站点地图中删除非规范网址。
8.指定为规范页面的非规范页面
当一个或多个页面指定规范化URL时,此问题会触发,该规范性URL也会规范化为不同的页面。这将创建一个“规范链”,其中页面A被规范化为页面B,然后将其规范化为页面C.
为什么这是一个问题
规范链可能会混淆和误导搜索引擎。结果,他们可能会误解或忽略指定的规范。
怎么修
使用指向规范的直接链接替换受影响页面的规范标记中的非规范链接。例如,如果将页面A规范化为页面B,然后将其规范化为页面C,则将页面A上的规范链接替换为指向页面C的链接。
9.打开图形URL不匹配规范
当一个或多个页面上指定的规范URL与打开图形URL不匹配时,将触发此问题。
为什么这是一个问题
如果打开图形URL与规范不匹配,则将在社交网络上共享页面的非规范版本。
怎么修
更换打开图形的URL与规范受影响的页面URL。确保两个URL相同。
打开图形标记内的URL必须是绝对的,并使用http://或https://协议,与规范的情况一样。
10.从HTTPS到HTTP的规范
当一个或多个安全(HTTPS)页面将非安全(HTTP)版本指定为规范时,将触发此问题。
为什么这是一个问题
HTTPS是一个排名因素,因此在可能的情况下将页面的安全版本指定为规范是有意义的。
怎么修
将HTTP页面重定向到HTTPS等效项。如果无法做到这一点,请从HTTP版本的页面添加rel =“canonical”链接到HTTPS。
11.从HTTP到HTTPS的规范
当一个或多个非安全(HTTP)页面指定安全(HTTPS)版本作为规范时,将触发此问题。
为什么这是一个问题
HTTPS优先于HTTP。拥有HTTP版本的页面然后将HTTPS版本指定为规范是不合逻辑的。
这可能不会造成巨大的问题,但如果可能的话仍然值得修复。
怎么修
实现从HTTP到HTTPS的301重定向。您还应该使用直接链接到HTTPS版本的页面的HTTP版本替换任何内部链接。
12.非规范页面接收自然流量
当一个或多个非规范页面出现在搜索结果中并获得自然搜索流量(不应该发生)时,会触发此问题。
为什么这是一个问题
您的规范标签设置不正确或搜索引擎已选择忽略指定的规范。
怎么修
检查是否在所有报告的页面上正确设置了rel = canonical标记。如果这不是问题,请使用百度站长工具中的网址检查工具查看他们是否将指定的规范网址视为规范网址。如果存在不匹配,请调查为什么会出现这种情况。
最后的想法
规范标签不是那么复杂。他们最初很难理解。
排名第一. https://www.paimingdiyi.com/932.html 版权所有. 转载时必须以链接形式注明作者和原始出处及本声明。