像你一个人一样想象你的内容。你是不是携带了一些你可以摆脱的包袱?携带你想保留但可能想重新借助或以不同方法看待的东西?
这在网站内容方面没什么不一样。大家都可能坐在一块考虑大家想从网站上删除的内容,但意识到仍然需要它,无论是针对特定的潜在顾客、内部团队等。
虽然大家为了内容管理的目的探寻尽量精简大家的网站的办法,但大家也期望如此做以安抚爬行搜索引擎机器人。
大家期望他们天天对大家网站的访问迅速而简洁。
这有期望向他们展示大家是哪个,大家是关于什么的,与最后——假如大家需要拥有没办法删除的内容——大家怎么样为他们贴上标签。
幸运的是,搜索引擎爬虫想要知道大家的内容,就像大家想要的一样。大家有机会规范化内容和无索引内容。
但,请注意,假如不正确实行此操作,或许会致使要紧的网站内容被搜索引擎爬虫误解或根本没办法阅读。
何时用Canonical?
规范标签提供了一种指导搜索引擎的好办法:“是的,大家了解这个内容不是那样独特或有价值,但大家需要拥有它。”
这也是一种将价值指向来自另一个域的内容的好办法,反之亦然。
尽管这样,目前是你向爬行机器人展示你怎么样看待网站内容的时候了。
要用,你需要将此标记放在源码的头部。
规范标签可能是处置你了解重复或一样的内容的好办法,但它需要存在以满足站点上的用户需要或缓慢的站点维护团队。
假如你觉得此标记很合适你的网站,请查询你的网站并解决看上去具备单独 URL 但内容一样的网站部分(比如,副本、图像、标题、标题元素等)。
既然你对相似性的状况有了非常不错的感觉,你需要知道这种缺少唯一性是不是值得规范化。以下是一些示例和解决方法:
示例 1:你的网站同时存在于网站页面的HTTP 和 HTTPS版本,或者你的网站同时存在 www和根域名版本。
解决方法:在链接、内链等数目最多的页面版本上放置一个规范标签,直到你可以一对一地重定向所有重复页面。
示例 2:你销售高度一样的商品,这类页面上没唯一副本,但名字、图像、价格等略有不同。你是不是应该规范地将特定商品页面指向商品父页面?
解决方法:在这里,我的建议是什么都不做。这类页面足够独特,可以编入索引。它们具备区别它们的唯一名字,这可以帮助你获得长尾关键词实例。
示例 3:你销售 T 恤,但每一个颜色和每件衬衣都有一个页面。
解决方法:Canonical 标记颜色页面以引用父衬衣页面。每一个页面都不是一个特定的商品,只不过一个很一样的变体。
用例:足以成功的规范标记内容
与上面给出的示例类似,我想讲解一下,有时,稍微一样的内容仍然合适索引。
若是带有不同衬衣种类(如长袖、背心等)的子页面的衬衣如何解决?这目前变成了一个不一样的商品,而不止是一个变体。如前所述,这可以成功用于长尾互联网搜索。
这是一个非常不错的例子:一个车辆销售网站,其中包括汽车制造商、有关车型与这类车型的变体(2Dr、4Dr、V8、V6、豪华版等)的页面。该站点的刚开始想法是所有变体都只不过模型页面的近乎重复。
你或许会想,当大家可以将这类页面规范化以指向模型页面作为代表页面时,为何还要用这种近乎重复的内容来惹恼搜索引擎呢?
大家朝着这个方向前进,但仍然对这类页面能否成功的焦虑使大家转向规范地标记每一个相应的模型页面。
假设你规范地标记到父模型页面。即便你向搜索引擎显示内容重要程度/层次结构,假如搜索相对具体,它们仍可能对规范化页面进行排名。
那样,大家看到了什么?
大家发现子页面和父页面的自然流量都增加了。我觉得,当你将功劳归还给子页面时,父页面看着拥有更多网站权重,由于它有很多子页面目前被归还“功劳”。
所有这类页面的月访问量加在一块增长了五倍。
自大家修订规范标签以来,该网站地区的每月自然流量目前是 5 倍,其中 754 个页面推进了自然流量,而去年早些时候为 154 个页面。
不要犯这类规范化错误
在分析到最后页面之前设置可以承受重定向的规范标签或许会导致非常大的损害。这将减少搜索引擎的速度,由于它迫使他们尝试理解内容的重要程度,但目前正在跳转 URL。
同样,假如你将规范标签指向作为 404 错误页面的 URL 目的,那样你事实上会将它们指向一堵墙。
对错误页面版本的规范标记(即 www./non-www.、HTTP/HTTPS)。大家讨论了通过网站抓取工具发现你可能无意复制网站。不要将页面重要程度错误地指向较弱的页面版本。
何时用noindex?
你还可以借助 meta robotsnoindex 标签来完全排除相似或重复的内容。
将 noindex 标签放在源码的 head 部分将阻止搜索引擎对这类页面进行索引。
注意:虽然 meta robots noindex 标签是一种从排名考虑中删除重复内容的迅速办法,但假如你未能正确用它,它或许会对你的自然流量导致危险。
这个标签过去曾被用来清除大型网站,只显示搜索重点的网站页面,以便网站抓取支出尽量高效。
但,你期望搜索引擎查询所有有关网站内容,以知道网站分类和页面层次结构。
但,假如这个标签不会吓到你太多,你可以用它让搜索引擎只抓取你觉得新鲜、独特的内容并将它编入索引。
以下是可以讨论 noindexing 作为解决方法的几种办法:
示例 1:为了帮助你的顾客,你可以提供制造商提供的文档,即便他们已经在其网站上提供了此功能。
解决方法:继续提供文档以帮助你的现场顾客,但不索引这类页面。
它们已经被制造商拥有和索引,这可能比你拥有更多的域权限。换句话说,你不太可能成为该内容的排名网站。
示例 2:你提供几种不同但一样的商品。唯一有什么区别是颜色、尺寸、计数等。大家不想浪费爬行成本。
解决方法:通过用规范标签来解决。长尾搜索可以带来合格的流量,由于给定的页面仍然会被索引并可以排名。
示例 3:你有不少不再销售的旧商品,不再是主要焦点。
解决方法:这种完美的场景非常可能出目前内容或销售审计中。假如商品对公司没什么用途,考虑退休。
考虑将这类页面规范地指向有关的分类页面或将它们重定向到有关的分类页面。这类页面有年龄/信赖,可能有链接,可能有排名。
用例:不要为了抓取支出考虑而牺牲排名/流量
关于大家的网站,大家了解大家期望为搜索引擎做出最好的贡献。
大家不想在抓取时浪费他们的时间,也不想叫人感觉大家的大多数内容都缺少独特质。
在下面的示例中,为了降低搜索引擎评论中有的一样的商品页面内容的膨胀,在域转换/重新启动期间将元机器人 noindex 标签放置在子商品变体页面上。
下图显示了从一个域转换到另一个域的总关键词数目。
移除 meta robots noindex 标签后,排名词的总量增长了 50%。
不要让这类元机器人 Noindex 错误
不要在具备入站链接值的页面上放置meta robots noindex 标签。若是如此,你应该将有关页面永久重定向到另一个有关的网站页面。放置标签将消除你拥有些宝贵链接资产。
假如你不索引包括在主导航、页脚或支持导航中的页面,请确保指令不是“noindex,nofollow”而是“noindex,follow”,以便正在抓取该网站的搜索引擎仍然可以通过通过 noindexed 页面上的链接。
结论
有时非常难与网站内容分道扬镳。
canonical 和 meta robots noindex 标签是为所有用户保留网站功能同时也指导搜索引擎的好办法。
最后,小心你怎么样标记!假如你不完全知道标记过程,比较容易丢失搜索结果。