百度对重复内容是如何处理的?
[日期:10-09-27]
由于现在的互联网转载、复制的现象较明显,
有的甚至是完全模仿某网站的页面自己再搞一个分站点。
(这里不说采集这种无前途的方式)
百度对这种页面是如何处理的?
现在看到的一些结果是原本运营了不短时间的网站,随着这个竞争网站模仿页面的收录,自己的页面排名逐渐下降。
这的确是个显著的问题。这表明我们在这方面的策略上有极大改进空间。这类积重的问题,非一朝一夕能搞定,需要伤筋动骨的动动手术才行。所以请大家耐心。
另外需要说明的是,搜索引擎的排序出发点,是用户的搜索体验。虽然说,很多时候尊重原创和用户体验是一致的。但是,毕竟也有一些case,转载的体验会比原创更好。这时候原创者的排序未必会高于转载者。但无论如何,原创者的应该以另外一种方式被肯定,而不是简单的被聚合掉。
问:百度如何面对很难处理的重复页面,比如列表页有分页,文章页也有分页,他们的meta都是相同的,这样会不会当重复页面处理。同时比如一个论坛有两篇相同的帖子都收录,会影响先收录的排名吗?
答:1,判定页面重复的算法很复杂。可以肯定的是,仅meta相同,是不会被判为重复的。
2,相同两个帖子被收录(URL可能不同),低权重的页面会不被建索引,或者被高权重页面类聚掉。