百度颶風(fēng)算法上線后,將于9月底推出微風(fēng)算法,重點(diǎn)打擊網(wǎng)頁標(biāo)題行為。從搜索引擎算法的發(fā)展歷史來看,標(biāo)題一直是重要的排名標(biāo)準(zhǔn)之一。對(duì)于許多從事新聞傳播和自媒體的人來說,一個(gè)好的頭銜甚至是成功的一半。對(duì)于同一篇文章,另一個(gè)標(biāo)題可能是100000+。
僅僅因?yàn)闃?biāo)題的重要性,那些欺騙用戶點(diǎn)擊標(biāo)題的行為也非常普遍。用戶體驗(yàn)極其糟糕,從長遠(yuǎn)來看,這將對(duì)搜索引擎的聲譽(yù)產(chǎn)生不良影響。
例如,如果我想搜索并下載一本電子書,搜索結(jié)果的標(biāo)題中有“下載”,但頁面上只有簡(jiǎn)短的介紹,我根本找不到下載地址。當(dāng)連續(xù)幾次搜索結(jié)果相同時(shí),我感到憤怒并想發(fā)誓。
但是為了避免被算法擊中和誤傷,我們需要仔細(xì)閱讀百度算法的描述,自我檢查并糾正標(biāo)題。
百度對(duì)標(biāo)題的定義:
標(biāo)題是指網(wǎng)頁代碼中標(biāo)題部分的內(nèi)容
百度對(duì)標(biāo)題角色的描述:
請(qǐng)參閱標(biāo)題以大致了解頁面內(nèi)容的內(nèi)容。
有兩種情況:
一、標(biāo)題是假的。指標(biāo)題表達(dá)與實(shí)際頁面內(nèi)容不一致,涉嫌欺騙用戶的行為。
二、故意堆疊關(guān)鍵詞。指重復(fù)和重疊的關(guān)鍵字。
什么是虛假的或過分的?以百度為例。(只能理解,不能量化)
百度舉了五個(gè)例子:
虛假官方網(wǎng)站,非官方網(wǎng)站表示為官方網(wǎng)站。標(biāo)題描述中有一個(gè)txt下載,但頁面不提供下載服務(wù)。標(biāo)題被描述為一個(gè)新穎的下載,但應(yīng)用程序是下載的。標(biāo)題表明百度云下載并支持在線瀏覽,但頁面既不能下載也不能在線瀏覽。標(biāo)題中的一些陳述是錯(cuò)誤的。比如,網(wǎng)頁的標(biāo)題顯示江蘇省有一所大學(xué)排名,但網(wǎng)頁上只有一份大學(xué)名單,沒有排名相關(guān)內(nèi)容。
結(jié)論如下:
不要假裝或出現(xiàn)在官方網(wǎng)站上。必須完成標(biāo)題中的下載或在線觀看。標(biāo)題中的陳述形式應(yīng)與實(shí)際內(nèi)容一致。(例如,當(dāng)提到排名時(shí),應(yīng)該有一個(gè)序列號(hào)列表,當(dāng)提到趨勢(shì)時(shí),應(yīng)該有一個(gè)趨勢(shì)圖。)
我認(rèn)為核心的標(biāo)準(zhǔn)是用戶不能點(diǎn)擊標(biāo)題來瀏覽內(nèi)容,感覺被欺騙了。
猜測(cè)百度能實(shí)現(xiàn)很好的語義識(shí)別功能,有一些現(xiàn)成的比較數(shù)據(jù)庫。
例如,當(dāng)標(biāo)題出現(xiàn)在官方網(wǎng)站上時(shí),百度很容易與該品牌官方網(wǎng)站的地址進(jìn)行比較。
如果標(biāo)題提到了小說下載,百度也很容易分析后綴為TXT、ePub、Mobi、CHM、UMD等文件是否可以下載,還可以分析文件大小和命名規(guī)則。
所有的例子基本上都可以通過分析實(shí)際頁面中的元素來總結(jié):你的標(biāo)題是否欺騙了用戶。
此外,百度還可能利用跳出率、頁面停留時(shí)間等數(shù)據(jù)輔助判斷(個(gè)人猜測(cè)),虛假標(biāo)題內(nèi)容的后果非常嚴(yán)重。