關(guān)鍵詞是SEO的核心概念之一,在SEO實(shí)踐中,很多工作都是圍繞關(guān)鍵詞展開的。本文試圖從搜索技術(shù)原理和網(wǎng)站優(yōu)化實(shí)踐相結(jié)合的角度,總結(jié)SEO中內(nèi)容頁面關(guān)鍵詞布局的具體落地方法。
1、 搜索引擎技術(shù)原理簡介
搜索引擎的核心底層技術(shù)是將用戶的查詢詞切割成自然語言中有意義的短語,然后從索引數(shù)據(jù)庫中找到包含這些短語全部或部分的內(nèi)容并返回結(jié)果。
正常人的搜索思路就是拿關(guān)鍵詞,去尋找內(nèi)容是否包含關(guān)鍵詞。假設(shè)您要從10個序列號為1-10的頁面中搜索包含“關(guān)鍵字布局”的頁面。在這10頁的全文搜索中搜索單詞“keyword layout”,然后返回包含該單詞的頁面的序列號。但是如果要從數(shù)百萬頁進(jìn)行搜索,速度會非常慢,所以我們發(fā)明了倒排索引的概念。(下圖中的數(shù)據(jù)不是實(shí)際數(shù)據(jù),僅供說明)
僅僅這一點(diǎn)還不足以對搜索結(jié)果進(jìn)行排序。在不作弊的情況下,某個關(guān)鍵字在網(wǎng)頁上出現(xiàn)的次數(shù)越多,該關(guān)鍵字就越能代表網(wǎng)頁的特征。前提是過濾掉停止詞(停止詞幾乎是每個網(wǎng)頁上的詞,但不能表達(dá)任何特定的意思,如:“de”、“yes”、“Le”等)。如果我們能在倒排索引表(縮寫為:詞頻TF)中加入出現(xiàn)在網(wǎng)頁中的關(guān)鍵字的頻率信息,就可以對網(wǎng)頁進(jìn)行排序。如下圖所示:當(dāng)我們的查詢詞被分為“關(guān)鍵字1”和“關(guān)鍵字2”時,相關(guān)網(wǎng)頁可以按(3,5,1,2)排序。
假設(shè)有兩個網(wǎng)頁1和2。倒排索引中的信息如下:
我們搜索“如何布局關(guān)鍵字”,搜索詞分為“關(guān)鍵字”、“如何”和“布局”。其中,“關(guān)鍵字”、“如何”和“布局”在網(wǎng)頁1中分別出現(xiàn)2次、2次和2次,共6次;在網(wǎng)頁2中,“如何”和“布局”出現(xiàn)7次。根據(jù)以上邏輯,終的搜索結(jié)果排名為(2,1),這顯然不是一個理想的排名結(jié)果。第2頁的主題顯然是關(guān)于“如何布局go”。此時,有必要引入逆文檔頻率索引(IDF)來解決這一問題。
關(guān)鍵詞的位置信息也是一個關(guān)鍵點(diǎn)。一般認(rèn)為,標(biāo)題中的關(guān)鍵字比正文部分的相同關(guān)鍵字更能反映網(wǎng)頁的主題特征。這就是H標(biāo)簽的重要性。搜索引擎還可以根據(jù)代碼布局和噪音比率(如停止詞的頻率)來確定導(dǎo)航、文本、側(cè)邊欄等的位置。這些位置信息將被標(biāo)記在倒排索引列表中,參與排序決策。
此外,還有一些其他常用的技術(shù)方法,如:雙詞索引/短語索引,“如何布局關(guān)鍵字”不一定要分為三個短詞,還可以分為“關(guān)鍵字布局”、“單詞如何”、“如何布局”等;組合查找相關(guān)詞,“關(guān)鍵字”的“關(guān)鍵字”和“如何”的“如何”等。
當(dāng)然,在實(shí)踐中,現(xiàn)代大型搜索引擎的倒排索引模型會復(fù)雜得多,而且很多其他因素(其中一個關(guān)鍵因素就是超鏈接分析)都會參與排序算法,而排序算法在空間和作者層次上都是有限的,所以不會繼續(xù)擴(kuò)展。
2、 如何布局關(guān)鍵字
1標(biāo)題中必須有關(guān)鍵詞,但不能有完整的疑問句
鑒于搜索引擎會將查詢詞分成n個以上的詞、雙詞和短語,并添加相關(guān)詞將查詢合并到查詢中,因此標(biāo)題中的關(guān)鍵字不一定是一個完整的問句,典型的是“哪個公司做XXX更好”。標(biāo)題不一定需要這個完整的詞。即使標(biāo)題包含了這個完整的短句,它也不能與其他完整的短句相匹配。一個高質(zhì)量的網(wǎng)頁通??梢云ヅ鋽?shù)百個長尾關(guān)鍵詞。顯然,一個標(biāo)題不可能包含所有這些內(nèi)容。標(biāo)題的另一個重要作用是吸引點(diǎn)擊,點(diǎn)擊率也是影響排名的一個因素。但是,核心詞“XXX”、“good”和“company”必須出現(xiàn)。
2一些核心詞和切分詞在文本中自然均勻分布
在搜索引擎開發(fā)的早期,很多技術(shù)人員利用TF*IDF算法的高權(quán)重漏洞堆積大量的關(guān)鍵詞,從而快速獲得更好的搜索排名。后來,搜索引擎從算法層面修補(bǔ)漏洞,打擊作弊行為,網(wǎng)絡(luò)上出現(xiàn)了“理想關(guān)鍵詞密度3%-8%”的流行觀點(diǎn)。首先,這種密度不是計算完整的查詢詞,而是計算所有分詞后的詞。在實(shí)踐中,你會發(fā)現(xiàn)有些頁面的關(guān)鍵詞密度略低于3%,而有些頁面的關(guān)鍵詞密度高于8%,都可以獲得很好的排名。
如果你是一名搜索引擎工程師,你會怎么做?我想我會結(jié)合整個網(wǎng)絡(luò)的歷史訪問數(shù)據(jù)(如百度統(tǒng)計、手機(jī)百度等可以獲得更全面的訪問數(shù)據(jù))和關(guān)鍵詞密度信息來劃定合理的范圍和預(yù)警范圍。超出警戒范圍的將被沉默處理。在預(yù)警范圍內(nèi),結(jié)合站點(diǎn)的歷史數(shù)據(jù)和階段小流量訪問數(shù)據(jù)的排名反饋,決定是抑制還是維持還是給予更高的排名。
與關(guān)鍵詞的密度相比,我們更應(yīng)該注重語言的流暢性(盲目插入關(guān)鍵詞顯得冗長而尷尬)以及內(nèi)容的質(zhì)量和深度。畢竟,搜索引擎的排名因素達(dá)到了幾,它們不能相互忽視。
3文本底部的相關(guān)內(nèi)容和側(cè)邊欄推薦適當(dāng)?shù)牟季株P(guān)鍵字
雖然搜索引擎可以通過代碼和噪聲比來判斷這些不是身體部位,從而減輕一些關(guān)鍵詞在這里的權(quán)重,但是從百度快照緩存來看,還是有一點(diǎn)效果的。
正文和側(cè)邊欄底部的相關(guān)內(nèi)容和推薦內(nèi)容大多是從橫向和縱向兩個角度選取的。比如,本文的主題是“關(guān)鍵詞布局”,橫向推送一些“網(wǎng)站結(jié)構(gòu)布局”、“關(guān)鍵詞挖掘技巧”等站內(nèi)優(yōu)化內(nèi)容,可能會引起很多游客的興趣;縱向推一些“教你如何打造高質(zhì)量的外鏈”和“如何提高轉(zhuǎn)化率”“登陸頁面”也是隱藏的需求,訪問者可能會暫時限制。同時,它還可以提高PV,減少反彈,改善用戶體驗(yàn)。為什么不。