从其他网站上抓取和复制内容的网站通常能够超越原始来源,本文中的示例将证明这一点。
这些“内容窃贼”能够破坏原始网站的排名,导致搜索可见性,潜在销售和潜在客户的损失。
这里的示例质疑了Google处理内容抓取工具的有效性。目前,Google似乎无法始终如一地识别原始内容来源。对于内容创建者来说,这是一个真正的问题。
在Pi Datametrics在上周布莱顿SEO会议上发表讲话之前,我们设计了一个测试,看看通过复制内容来破坏另一个网站的排名是多么容易。
在这篇文章中,我将看看这些测试的结果,并讨论出版商可以采取哪些措施来解决这个问题。
注意:这些示例来自Google.co.uk。
复制网站可以超过原件吗?
当Pi Datametrics注意到客户搜索排名的波动性时,测试的最初想法出现了。
经过一番调查,他们发现原因是内容盗窃。
示例1:按设计旅行
Journeys by Design是一个提供豪华非洲野生动物园假期的网站。它为其页面制作了一些经过深入研究的内容,例如专门为Journeys by Design编写的内容。
然而,这个副本被逐字逐句地提升,并被另一个也提供野生动物园假期的网站使用。
它也被至少三个其他网站复制,例如:
理论上,Google应该识别内容的原始来源,并确保模仿网站的排名不高于相关搜索的原始网站。然而,这并没有发生。
下图显示了八个月期间“山地大猩猩巢”一词的搜索排名。蓝线显示了Journeys by Design的排名。其他行来自复制原始内容的网站。

我们可以看到原始网站在此期间的排名最为一致,但也有一些模仿网站也能够在不同时间排名。
虽然最重要的事实是这些模仿网站也超过了原版,导致Journeys by Design在一次数天和数周内滑落到100位置。
这显然具有商业意义,因为寻找野生动物园假期的搜索者将无法找到具有其目标条款之一的网站,这要归功于模仿者。
考试
注意到这一点后,Pi Datametrics决定设置一个测试,看看对被盗内容进行排名是多么容易。
一般来说,模仿网站明显较弱,因为它们的链接较少,内容较少 – 除了从其他地方取消的内容。
这是否意味着任何弱点都可以简单地从强大的竞争对手那里窃取内容并超过它们?
例2:Econsultancy宁波小程序开发
为了找到答案,Pi Datametrics接受了关于PPC策略的采访,该策略发布在Econsultancy(我的旧网站)上, 并将其放在他们的
智能定位博客上。内容是经过他们的许可逐字逐句复制的。
搜索文章标题时,我们可以看到复制的版本会短暂地中断原始搜索位置。
但是,如果我们搜索更通用的术语,如“PPC策略”,内容窃贼能够超越原始术语,如红线所示。
似乎谷歌不知道哪一个应该排名一段时间,职位交换几天,但复制的文章最终胜出。
在我写这篇
文章的时候,
复制的文章位于谷歌的第25位,原来无处可见。
例3:ClickZ
使用
ClickZ内容进行相同的测试。在这种情况下,我们使用了Bryan Eisenberg关于Web表单优化的客座帖子。
同样,内容是逐字逐句复制的,其中的图像具有要说明的注释。
这个测试的结果很有趣。首先,它没有像前面两个例子那样打断
ClickZ的排名。
在复制文章之后,原始版本仍然合理地对“在线Web表单优化”这一短语进行排名。
奇怪的是,复制版本同时也排在同一个词的前三个位置。
仔细观察,您会注意到9月初的下跌与
ClickZ的搜索排名中的峰值相对应。它对
ClickZ的位置有影响,但没有我们预期的那么多。
然而,8月20日的低谷确实与另一个网站的高峰相对应:Bryan Eisenberg的博客。
Bryan 在他自己的博客上发表了他的
ClickZ帖子,并且在相同的搜索词中享受了一些不错的搜索可见性。虽然,这是在复制的文章发表之前。

Bryan的帖子几乎从这个学期的SERP中消失了,现在它被
ClickZ复制的版本所取代。
目前,山寨版本超过了原版
ClickZ版本,在谷歌英国排名第二
同时,
ClickZ文章位于以下五个位置,而Bryan Eisenberg的版本甚至没有进入前100名。
因此,再一次,
模仿网站能够破坏原始内容制作者的搜索排名,在一段时间内超过它们。
从
Intelligent Positioning博客中删除复制的版本后,我预计
ClickZ 将返回Google上的前两个或三个位置。布莱恩的帖子版本会发生什么还有待观察。
正如我之前提到的,这些测试是在Google UK上进行的(更多内容是使用.com),而且美国和英国之间的差异很有意思。
例如,虽然知识产权博客能够以复制的内容破坏布莱恩艾森伯格的英国排名,
但它在美国的SERP中并没有完全相同的效果。
它确实排名很短的时间,但我的猜测是,其他两个网站的权威和他们的美国位置的组合将其击倒。
此外,布莱恩的帖子版本继续超过
ClickZ,但谷歌仍然允许两个版本排名很高。
为什么这很重要?
内容对于实现SEO目标非常重要,尽管它确实拥有超越搜索引擎的生命。理想的文章很有用,随着时间的推移为读者提供价值,同时保持高搜索可见性。
在花费时间,精力和精力来撰写复杂的文章之后,发现另一个网站可以简单地窃取它并获得SEO收益是相当恼人的。
这强调了在按下“发布”按钮后长时间监控内容性能的重要性。通过密切监控网站的性能,您可以对模仿者采取措施。
此外,它还会影响跨多个站点使用的产品副本等内容,我将在以后的文章中详细介绍。
网站应该做什么?
网站可以采取多种措施:
此外,Bryan Eisenberg示例为接受访客帖子的网站提供了一个教训 。确保客人不在自己的网站上完全重新发布内容是值得的,因为这可能会影响您自己的排名。
根据我的经验,我发现最好让他们发布摘录并指回原文,从而避免这个问题。或者让他们使用rel = canonical链接来指示原始帖子。
这告诉了我们关于谷歌的什么?
一个明显的结论是,这是Google需要改进的领域。当允许复制内容时,这样就可以激励刮刀使用这种策略。
它确实在 去年推出了一个Scraper Report表格,邀请了比原件更高的山寨网站的例子。
它现在已经关闭,这表明该表单的目的是收集示例以帮助Google改进其算法。
更广泛地说,
谷歌处理这个问题的方法是不一致的。例如,在本文前面的“PPC策略”示例中,原始网站和模仿网站经常交换位置,就像Google无法确定哪个是模仿网站一样。
正如Pi Datametrics的 Jon Earnshaw所说:
内容被盗可能是一个非常令人沮丧和昂贵的问题。看起来Google的算法在处理重复内容时存在缺陷。
最好的办法是跟踪您的条款,看看其他人是否在损害您的网站。如果您有每日网址跟踪功能,则只能看到这种翻转位置。如果您看到无法解释的波动,然后深入挖掘,最终您可以向Google报告滥用行为。
综上所述
这里的例子告诉我们,复制的内容对于网站来说可能是一个真正的问题,它们将失去流量和潜在的销售,而不是他们自己的过错。
它还告诉我们内容窃贼可以获胜。他们可能无法一致排名,但他们只能通过作弊来达到高搜索位置。
从长远来看,我希望谷歌对复制内容的处理有所改善,但与此同时,
网站确实需要注意这个问题,以便他们采取适当的措施来尽量减少损害。