例如,如果你最初写的文章应该排名很好,但是其他人剽窃或转载了你的文章,而搜索引擎不幸地判断被复制或转载的页面是原始来源,那么你应得的排名将被该页面取消。
那么,搜索引擎如何从多个网页中找出原始来源呢?可能需要考虑以下几点:
1) 页面PR值。一个网页的PR值越高,就越有可能被认为是原始版本。
2) 网页首次包含的时间。一个网页被搜索引擎包含的时间越早,它就越有可能被用作原始来源,而不是后来找到的具有相同内容的网页。
3) 域名注册时间。域名越旧,页面被用作原始源的可能性就越大。
4) 网站的权威。这有点不清楚。它可能收录前三个因素,以及许多其他因素。
但到目前为止,无论是哪一个因素是主要因素,还是如何将这些因素结合起来,都不可能从多个网页中找出原始来源。
比如我的上海网站优化博客很新,域名也很新。有时,物品被收录的时间不一定是最早的。从权威地位和信任度来看,它肯定无法与许多中国网站相比。但我的博客是新的,我的域名是新的,并不意味着我的内容不是原创来源,其实我所有的博客都是原创的。
最近,我也发现很多网站转载,有时抄袭我的博客内容。很多网站的规模、历史和公关价值都比我的高很多。
在检测文章的原始来源方面,谷歌做得更好,基本上可以正确判断,百度做得更差。从我在不同地方出现的文章来看,百度似乎认为域名比较老是原创。