搜索引擎是一種特殊的計算機程序。它按照一定的策略從互聯(lián)網上收錄信息,對信息進行處理,為用戶提供檢索服務,并將檢索結果顯示給用戶。
SEO(SEO)是指利用搜索引擎規(guī)則來提高網站在搜索引擎中的自然排名。為了獲得更多的免費流量,讓其在行業(yè)中占據更高的優(yōu)勢,獲得更多的收益。
只有深入了解搜索引擎的原理,才能熟悉信息采集策略,掌握搜索引擎自然排名的規(guī)律,做好SEO工作。綜上所述,搜索引擎有兩個功能:一是主動從互聯(lián)網上抓取網頁,經過處理后存儲在數據庫中,等待用戶檢索;二是響應用戶檢索數據庫,并按照一定的規(guī)則顯示給用戶。具體如下圖所示:
搜索引擎主動抓取網頁,經過內容處理,建立索引,存儲數據庫,其過程一般如下。
1發(fā)送spider將網頁抓取回搜索引擎服務器,并按照一定的策略存儲原始網頁;
2鏈接分離、內容處理、噪聲消除、主文本提取和分詞統(tǒng)計;
3刪除重復網頁,建立網頁索引和關鍵詞映射;
搜索引擎根據一定的規(guī)則響應用戶的搜索請求并返回查詢結果。過程一般如下。
1接收到用戶查詢請求后的搜索詞處理,收錄指令處理、中文分詞、停止詞刪除、拼音校正等;
2根據用戶區(qū)域和搜索日志的特點,充分了解用戶需求、集成觸發(fā)、搜索框提示等;
3搜索引擎首先搜索歷史緩存。如果它已經存在,大多數數據可以直接返回。同時對更新進行調整,對返回的查詢結果進行整合;
4如果緩存不存在,則檢索關鍵字索引庫,并根據頁面權重、內容相關性(關鍵字用法、詞密度、詞位置、錨定鏈接等)、用戶體驗(頁面結構、信任度、點擊率、評論率、評論數等)返回排名結果集。過濾和微調后,反作弊策略將顯示給用戶。同時,緩存關鍵字搜索結果并記錄用戶行為日志,以便下次快速響應用戶查詢。