什么是重复内容?
重复内容是指在不同网站或同一网站不同页面上的相似或完全相同的内容。网站上有大量的重复内容会对谷歌排名产生负面影响。
也就是:
重复内容就是完全相同的内容出现在另一个页面。
重复内容也适用于不同页面中的类似或接近内容,甚至是轻微改写的内容。
重复内容如何影响搜索引擎优化?
一般来说,Google 不希望对重复内容的页面进行排名。
事实上,谷歌声称:
“谷歌努力索引和显示有独特信息的页面”。
因此,如果你的网站上没有明确的独特信息,可能会影响你的搜索引擎排名。
具体讲,包含有重复内容的网站有三个主要问题:
更少的自然流量: 很直接,谷歌不想在索引中为复制其他页面内容的页面进行排名。
(包括复制你自己网站其他页面的内容)
例如,假设你的网站上有三个内容相似的页面。
谷歌不确定哪个页面是“原创”的,所以这三个页面都很难排名。
惩罚(极其罕见) : 谷歌曾表示,重复内容可能会导致惩罚或完全关闭一个网站的索引。
然而,这种情况非常罕见的。而且只有当一个网站故意从其他网站上抓取或复制内容时才会这么做。
因此,如果你的网站上有一大堆重复的页面,不需要担心“重复内容的惩罚”。
减少索引页面: 这对于一个有很多页面的网站(比如电子商务网站)尤其重要。
有时候谷歌不仅仅是降低重复内容的排名,它还拒绝索引这类内容。
因此,如果你的网站上有页面没有被索引,这可能是因为抓取预算浪费在了重复内容上。
最佳实践
关注不同 url 上的相同内容
这是重复内容出现的最常见原因。
例如,假设你正在运作一个在线零售T恤产品的电子商务网站。
你有一个T恤产品页面。
如果正确设置的话,针对同一款式,不同尺寸、不同颜色的T恤产品应该出现在相同的URL中。

但是有时候很多人经常为同一产品的每个不同规格分别创建了一个新的 URL… 这会导致产生大量重复内容页面。
再看另一个例子:
如果你的网站有搜索功能,那些搜索结果页面也可以被索引。同样,这会为你的网站增加大量的页面。所有这些都包含重复内容。
检查索引页面
查找重复内容最简单的方法之一就是查看你网站上被谷歌索引的页面数量。
你可以通过在 Google 中搜索 site: example. com 来实现。
或者在 Google 搜索控制台中查看你的索引页面。
无论哪种方式,这个数字应该与你手动创建的页面数量一致。
例如,埃克森数字营销有77个页面的索引:
如果这个数字是1000或100,000,我们就会知道很多页面都是自动添加的。这些页面可能包含大量的重复内容。
另外,很多情况下,你用site命令和谷歌搜索控制台查询索引页面时,会发现,索引的页面会少于你实际的页面,常见的原因是:你最新发布的几个页面尚未被谷歌索引,这属于正常情况。
但如果是发现,有某个或某几个页眉发布很长时间(例如发布几个月)后,始终未被索引,这时候你需要检查是否你的页面包含重复内容,或者其他原因导致谷歌不索引页面。
确保网站正确重定向
有时候你不仅仅拥有同一个页面的多个版本… … 还有同一个站点的多个版本。
例如:
当你的网站的“ WWW”版本没有重定向到“non-WWW”版本时,这个问题会出现。
(反之亦然)
如果你把你的网站切换到 HTTPS,而没将HTTP网站重定向到 HTTPS 网站,这种情况也会发生。
简而言之: 所有不同版本的网站应该统一到同一个版本的网。
具体操作,每个网站应该有四个版本的URL,我们要做的是把四个版本的URL统一跳转到一个URL。
使用301重定向
301重定向是解决网站重复内容问题最简单的方法。
(当然还有删除页面)
因此,如果你网站上有一堆重复的内容页面,请将它们重定向回原始页面。
一旦谷歌机器人访问你网站,它将处理重定向并仅索引原始内容。
(这有助于原始页面排名)
留意类似的内容
其实重复内容并不仅仅是从其他地方完整复制的内容。
事实上,Google 将重复内容定义为:
因此,即使你的内容在技术上与现有内容不同,你仍然可能会遇到重复内容的问题。
对于大多数网站来说,这不是一个问题。大多数网站只有几十个页面。他们为每一页都写下独特的东西。
但是也有“相似”的重复内容会突然出现的情况。
例如,假设你运营一个网站,教人们如何讲法语。
你们为波士顿地区服务。
那么,您可能有一个围绕关键字“Learn French Boston”优化的服务页面:
还有一个网页是为关键词“Learn French Cambridge”排名。
虽然内容在技术上会有所不同。例如,一个页面列出了波士顿位置的位置。另一页是剑桥的地址。
但是在大多数情况下,这种内容是非常相似的。
这在谷歌眼中是重复内容。
为网站上的每个页面写100% 独特的内容很痛苦?是的。但是如果你真的想对网站的每一个页面进行排名,这是必须的。
使用 Canonical 标签
rel=canonical标签告诉搜索引擎:
“我们有一大堆重复内容的网页。但是这个页面是原始的。你可以忽略其余页面”。
谷歌曾经说过,使用Canonical签比屏蔽重复内容网页要好。
(例如,使用robots.txt 阻止谷歌机器人,或者在网页 HTML 中使用 noindex 标签)
因此,如果发现你的网站上有重复的内容,你要:
- 删除它们
- 重新定向他们
- 使用canonical标签
使用工具
一些搜索引擎优化工具可以帮助发现重复的内容。
例如,Siteliner 会扫描你的网站,寻找包含大量重复内容的页面。
需要注意:siteliner工具无法针对中文语言的网站进行分析。
合并页面
前文讲过,如果你有很多页面重复内容,你可以重定向到一个页面。
(或者使用 canonical 标记,也可以删除重复内容)
但是如果你的网页有相似的内容呢?
针对类似内容,埃克森建议两种方法:
- 为每一个页面创作独特的内容
- 把相似内容页合并成一个大型页面。
例如,假设你的网站上有3篇技术上不同的博客文章,但是内容几乎是一样的。
这种情况下,你可以把这3篇文章组合成一篇100% 独特的博客文章。
因为你从网站删除了一些重复的内容,那个页面的排名应该比其他3个页面的排名加起来还要好。
Noindex WordPress标签或分类页面
如果你使用 WordPress,你可能已经注意到它会自动生成标签和类别页面。
这些页面是重复内容的巨大来源。
因为它们对用户体验很有用,埃克森数字营销建议在这些页面中添加“ noindex”标记。这样,他们就可以不需要搜索引擎索引他们。
你也可以在 WordPress 中进行设置,让页面不自动生成标签。
谷歌如何处理重复内容? : 谷歌的马特 · 卡茨关于谷歌如何关注重复内容的视频。
重复内容惩罚的认识误区: 这篇文章讲述了为什么大多数人不需要担心“重复内容惩罚”。