什么是内容重复?
重复的内容一般是指在不同域名间存在大量的相同或相似的内容。很多时候,它并非故意或至少本无恶意。譬如说,有些论坛会生成一些专为手机屏幕的页面;商店物品被显示在(有时甚至是链接到)多种不同的URL上,等等。但有些时候,一些网站为了操纵搜索引擎排名,获得更多流行或长尾查询的访问量,大量地从其他网站复制内容。(Chris.DL:一般网站的重复内容有3种情况,网站本身的内容重复;网站因为URL的设置问题导致的内容重复;网站内容采集)
什么不是重复内容?
虽然谷歌网站有方便易用的翻译功能,我们的算法不会把有着相同内容的英文版和西班牙文版看作内容复制。同样,你不用担心我们把你文章中对其他文章小片段的引用认定为重复内容。(Chris.DL:大片段的引用算不算呢?这篇文章算不算重复内容呢)
为什么谷歌关心重复内容?
谷歌用户使用Google时通常希望看到多样化的原创内容。如果他们找到的都是内容相同的一堆搜索结果,可以想见那是多么烦人。另外,网站管理员不愿意看到Google给出象example.com/contentredir?value=shorty-george?=en一样复杂的URL。他们往往更喜欢类似example.com/en/shorty-george.htm的URL。(Chris.DL:因为URL设置导致的重复内容是非常冤的一件事情)