當(dāng)用戶用關(guān)鍵字搜索信息時,搜索引擎將在數(shù)據(jù)庫中搜索。如果找到符合用戶需求的網(wǎng)站,它會使用一種特殊的算法來計算每個頁面的相關(guān)性和排名級別,然后根據(jù)相關(guān)性,將這些頁面鏈接按順序返回給用戶。
搜索引擎排名基本分為四個步驟:
1、 爬行和抓取
搜索引擎發(fā)出一個程序,可以在網(wǎng)上找到新的網(wǎng)頁和抓取文件。這個程序通常被稱為spider。搜索引擎從已知的數(shù)據(jù)庫開始,就像普通用戶的瀏覽器一樣訪問這些網(wǎng)頁并抓取文件。搜索引擎將跟蹤網(wǎng)頁中的鏈接并訪問更多的網(wǎng)頁。這個過程稱為爬網(wǎng)。這些新的URL將存儲在數(shù)據(jù)庫中等待爬網(wǎng)。因此,跟蹤網(wǎng)頁鏈接是搜索引擎蜘蛛尋找新網(wǎng)址的最基本方式,反向鏈接成為SEO的最基本因素之一。沒有反向鏈接,搜索引擎甚至找不到網(wǎng)頁,更別說排名了。
搜索引擎抓取的頁面文件與用戶瀏覽器獲取的頁面文件完全相同,抓取的文件存儲在數(shù)據(jù)庫中。
2、 索引
蜘蛛抓取頁面文件分解、分析,并以巨大的形式存儲在數(shù)據(jù)庫中,這個過程就是索引。在索引數(shù)據(jù)庫中,網(wǎng)頁的文字內(nèi)容、關(guān)鍵字位置、字體、顏色、粗體、斜體等相關(guān)信息都有相應(yīng)的記錄。
3、 搜索詞處理
用戶在搜索引擎界面輸入關(guān)鍵字,點擊“搜索”按鈕后,搜索引擎程序會對搜索詞進(jìn)行處理,如中文特定分詞、刪除停止詞、判斷是否需要啟動集成搜索、判斷是否有拼寫錯誤或打字錯誤等,搜索詞的處理速度必須非??臁?/p>
4、 排序
搜索引擎程序在對搜索詞進(jìn)行處理后,會開始工作,從索引數(shù)據(jù)庫中找出包含搜索詞的所有頁面,并根據(jù)排名算法計算出哪些頁面應(yīng)該排在前面,然后按照一定的格式返回到“搜索”頁面。
搜索引擎再好,也比不上人。這就是為什么網(wǎng)站需要SEO。沒有SEO的幫助,搜索引擎往往無法正確返回最相關(guān)、最權(quán)威、最有用的信息。