例如,如果你最初寫的文章應該排名很好,但是其他人剽竊或轉載了你的文章,而搜索引擎不幸地判斷被復制或轉載的頁面是原始來源,那么你應得的排名將被該頁面取消。
那么,搜索引擎如何從多個網(wǎng)頁中找出原始來源呢?可能需要考慮以下幾點:
1) 頁面PR值。一個網(wǎng)頁的PR值越高,就越有可能被認為是原始版本。
2) 網(wǎng)頁首次包含的時間。一個網(wǎng)頁被搜索引擎包含的時間越早,它就越有可能被用作原始來源,而不是后來找到的具有相同內容的網(wǎng)頁。
3) 域名注冊時間。域名越舊,頁面被用作原始源的可能性就越大。
4) 網(wǎng)站的權威。這有點不清楚。它可能收錄前三個因素,以及許多其他因素。
但到目前為止,無論是哪一個因素是主要因素,還是如何將這些因素結合起來,都不可能從多個網(wǎng)頁中找出原始來源。
比如我的上海網(wǎng)站優(yōu)化博客很新,域名也很新。有時,物品被收錄的時間不一定是最早的。從權威地位和信任度來看,它肯定無法與許多中國網(wǎng)站相比。但我的博客是新的,我的域名是新的,并不意味著我的內容不是原創(chuàng)來源,其實我所有的博客都是原創(chuàng)的。
最近,我也發(fā)現(xiàn)很多網(wǎng)站轉載,有時抄襲我的博客內容。很多網(wǎng)站的規(guī)模、歷史和公關價值都比我的高很多。
在檢測文章的原始來源方面,谷歌做得更好,基本上可以正確判斷,百度做得更差。從我在不同地方出現(xiàn)的文章來看,百度似乎認為域名比較老是原創(chuàng)。