站長(zhǎng)們?yōu)榱四軌蚋玫臋z測(cè)網(wǎng)站優(yōu)化的情況,幾乎每天都會(huì)做一日常的統(tǒng)計(jì),而網(wǎng)站的抓取是否出現(xiàn)異常也是在這個(gè)數(shù)據(jù)統(tǒng)計(jì)的行列中,然后根據(jù)每日的記錄下來(lái)的情況,站長(zhǎng)們還要做一些分析和優(yōu)化措施。那么出現(xiàn)異常抓取的原因是什么?
什么是網(wǎng)站異常抓取?
這個(gè)就是在正常的條件下,百度蜘蛛所抓取的頁(yè)面與呈現(xiàn)給訪客的頁(yè)面內(nèi)容是一樣的,但是除此之外的一切就是非正常情況,從而導(dǎo)致蜘蛛無(wú)法正常抓取頁(yè)面。這個(gè)樣子的就被稱為抓取異常,抓取異常存在的原因是什么?
用百度搜索資源平臺(tái)診斷網(wǎng)站的抓取異常情況,如果發(fā)現(xiàn)偶爾抓取失敗,則屬于正常情況,不會(huì)對(duì)網(wǎng)站的正常抓取和收錄造成影響。但如果抓取失敗出現(xiàn)持續(xù)性的,則要引起注意了,根據(jù)網(wǎng)站出現(xiàn)抓取異常的具體原因做具體的分析。
一、網(wǎng)絡(luò)異常
?、佟NS異常:當(dāng)網(wǎng)址出現(xiàn)了IP地址錯(cuò)誤,或者域名服務(wù)商將搜索引擎封禁的其中一種情況時(shí),就會(huì)導(dǎo)致搜索殷勤無(wú)法解析這個(gè)網(wǎng)站的IP底子,會(huì)出現(xiàn)dns異常。
②、鏈接超時(shí):當(dāng)服務(wù)器過(guò)載,或者是網(wǎng)絡(luò)不穩(wěn)定等情況,就會(huì)導(dǎo)致搜索引擎無(wú)法抓到頁(yè)面。
③、抓取超時(shí):一個(gè)網(wǎng)站頁(yè)面的加載速度一直時(shí)一個(gè)嚴(yán)重的問(wèn)題,對(duì)用戶和搜索引擎的體驗(yàn)是有著一個(gè)很大的影響,但是如果服務(wù)器過(guò)載,夸帶不足,搜索引擎雖成功建立了抓取請(qǐng)求,但是因?yàn)轫?yè)面的速度過(guò)慢,無(wú)法在時(shí)間內(nèi)抓取頁(yè)面,從而導(dǎo)致抓取超時(shí)。
?、?、連接錯(cuò)誤:當(dāng)服務(wù)器運(yùn)行不正常,導(dǎo)致搜索引擎無(wú)法連接上網(wǎng)站服務(wù)器,或者在連接之后,對(duì)方服務(wù)器拒絕你的請(qǐng)求,這些都會(huì)導(dǎo)致搜索引擎連接錯(cuò)誤。
二、鏈接異常
?、佟⒎?wù)器錯(cuò)誤:因?yàn)榉?wù)器錯(cuò)誤,導(dǎo)致網(wǎng)站出現(xiàn)了5XX類(lèi)型的錯(cuò)誤,在搜索引擎抓取時(shí),正確的返回狀態(tài)碼是5XX。
?、?、找不到頁(yè)面:
頁(yè)面無(wú)法訪問(wèn),是比較典型的404錯(cuò)誤。在搜索引擎抓取時(shí),正確的返回狀態(tài)碼是404。
③、訪問(wèn)被拒絕
搜索引擎抓取頁(yè)面時(shí),所發(fā)出的請(qǐng)求被拒絕,導(dǎo)致網(wǎng)站出現(xiàn)403錯(cuò)誤。在搜索引擎抓取時(shí),正確的返回狀態(tài)碼是403。
④、其他錯(cuò)誤
還可能發(fā)生其他的錯(cuò)誤,導(dǎo)致網(wǎng)站出現(xiàn)4XX類(lèi)型錯(cuò)誤。在搜索引擎抓取時(shí),正確的返回狀態(tài)碼是4XX,不包括403和404。
如果網(wǎng)站出現(xiàn)抓取異常的話,會(huì)讓搜索引擎認(rèn)為這個(gè)網(wǎng)站,在用戶整體的一個(gè)體驗(yàn)上是有著一些缺陷的,并且降低了對(duì)網(wǎng)站的評(píng)價(jià),在抓取。索引、權(quán)重上都會(huì)受到一定程度的負(fù)面影響,從而影響到整個(gè)網(wǎng)站的流量。
文章來(lái)源:優(yōu)幫云優(yōu)化