SEO工具底層算法核心TF-IDF,主要策略是增加相關(guān)詞的覆蓋率,以及高優(yōu)布局關(guān)鍵詞密度,從而在百度谷歌等搜索引擎內(nèi)容質(zhì)量這一項(xiàng)上的排名加分,獲取超高分值,下面黑帽百科來(lái)給大家講講TF-IDF算法,如果你還在沒(méi)有關(guān)注TF-IDF算法,那就真的會(huì)晚了。

什么是TF-IDF算法
百度百科這樣說(shuō):https://baike.baidu.com/item/tf-idf
“TF-IDF算法可以說(shuō)是一種統(tǒng)計(jì)算法,用一個(gè)關(guān)鍵詞評(píng)估在一篇文章或一份文件中的重要程度,關(guān)鍵詞的重要性隨著關(guān)鍵詞出現(xiàn)頻率的增加而增加,同時(shí)也會(huì)隨著在語(yǔ)料庫(kù)中出現(xiàn)的頻率成反比下降,TF-IDF算法被各大搜索引擎平臺(tái)所引用,也是作為評(píng)估關(guān)鍵詞相關(guān)程度的的度量或評(píng)級(jí)依據(jù)。

大家是不是看了上面的似懂非懂呢?其實(shí)沒(méi)有一定SEO基礎(chǔ)知識(shí)的朋友是看不懂的,下面為了大家理解,舉例給大家說(shuō)明。
例如有網(wǎng)民在搜索引擎上搜索““水果”這個(gè)名詞,搜索引擎給排名前五的網(wǎng)站有5個(gè),以下5條內(nèi)容你覺(jué)得哪條會(huì)排在第一名呢?
– 內(nèi)容1: 水果有水果,水果,水果,水果,水果
– 內(nèi)容2: 水果有蘋果,桃子,西瓜,菠蘿,梨子
– 內(nèi)容3: 蔬菜都很好吃,我最愛(ài)吃茄子了
– 內(nèi)容4: 蘋果,梨子都是很好吃的水果
– 內(nèi)容5:好吃的水果有西瓜,蘋果,葡萄,其他水果還有菠蘿,獼猴桃
其實(shí)大家一看就知道了答案,第2條和第5條是非常有希望排在第一名或者第二名的,如果按照TF-IDF算法基本也是這個(gè)結(jié)果,那么TF-IDF算法是如何計(jì)算的呢?我們接著往下看。
TF-IDF算法的計(jì)算步驟
1、計(jì)算逆文檔頻率
先來(lái)統(tǒng)計(jì)各個(gè)關(guān)鍵詞語(yǔ)被包含的文章數(shù),例如“水果”這個(gè)詞就被1、2、4、5文章所引用,第4條為“水果”的逆文檔頻率。
通過(guò)分詞后,各個(gè)關(guān)鍵詞語(yǔ)的逆文檔頻率是:
水果=4、蘋果=3、好吃=2、菠蘿=2、西瓜=2、梨子=2,桃子=1、獼猴桃=1、蔬菜=1,茄子=1

PS: IDF= log(語(yǔ)料庫(kù)中的文件總數(shù) / 包含詞語(yǔ)的文件數(shù)目),為了便于理解,這里做了精簡(jiǎn)。
一篇優(yōu)質(zhì)的文章把逆文檔頻率最高的前面的關(guān)鍵詞都包含了,說(shuō)明這篇文章更有利于用戶意圖,搜索引擎也喜歡這樣的文章,我們?cè)倏纯匆陨系睦樱彼焙汀疤O果“是這個(gè)例子中最重要的2個(gè)詞語(yǔ),如果這篇文章中包含有“水果、蘋果”,那么這篇內(nèi)容質(zhì)量度就會(huì)不錯(cuò)的。
所以我們把包含“水果、蘋果”的內(nèi)容拿出來(lái),就是比較靠譜的內(nèi)容了:
– 內(nèi)容2: 水果有蘋果,桃子,西瓜,菠蘿,梨子
– 內(nèi)容4: 蘋果,梨子都是很好吃的水果
– 內(nèi)容5: 好吃的水果有西瓜,蘋果,葡萄,其他水果還有菠蘿,獼猴桃;
2、計(jì)算詞頻(TF)
把第1條和第3條內(nèi)容刪掉,余下2、4、5這幾條內(nèi)容,那么這幾條內(nèi)容要如何排序呢?一個(gè)關(guān)鍵詞在內(nèi)容中出現(xiàn)的頻率越高,說(shuō)明這個(gè)關(guān)鍵詞對(duì)這篇文章就越重要,再次回到以上這個(gè)例子,“水果”是這篇文章的核心關(guān)鍵詞,由于第5條內(nèi)容中“水果”出現(xiàn)頻率有兩次,第2、4條內(nèi)容中出現(xiàn)的次數(shù)只有1次,所以第5條內(nèi)容就排在了第一名,排序結(jié)果如下:
– 內(nèi)容5: 好吃的水果有西瓜,蘋果,葡萄,其他水果還有菠蘿,獼猴桃 (第一名)
– 內(nèi)容2: 水果有蘋果,桃子,西瓜,菠蘿,梨子(第二名)
– 內(nèi)容4: 蘋果,梨子都是很好吃的水果(第三名)
-內(nèi)容1: 水果有水果,水果,水果,水果,水果(相關(guān)度不夠,被剔除)
-內(nèi)容3: 蔬菜都很好吃,我最愛(ài)吃茄子了( 相關(guān)度不夠,被剔除 )
以上就是給大家精簡(jiǎn)后的TF-IDF算法,TF-IDF算法運(yùn)行起來(lái)比這個(gè)要復(fù)雜的多,以上只是讓大家明白TF-IDF算法其本運(yùn)行原理。
TF-IDF對(duì)SEO非常重要!非常重要!非常重要!
重要的事情說(shuō)三遍!
由此我們可以看出TF-IDF算法不但衡量著關(guān)鍵詞對(duì)頁(yè)面的重要性,更能衡量文章的廣度相關(guān)性,對(duì)于各大搜索引擎來(lái)說(shuō),TF-IDF算法幫助搜索引擎屏幕了一大批依靠關(guān)鍵詞密度作弊來(lái)獲得排名的SEO小白,TF-IDF算法還提升了搜索質(zhì)量,對(duì)于搜索引擎來(lái)說(shuō)真是好處多多。
百度百科描述到:“除了TF-IDF以外,搜索引擎平臺(tái)還會(huì)引用基于鏈接分析的評(píng)級(jí)方法,確定文件在搜索引擎排序結(jié)果中出現(xiàn)的先后順序,通俗地講就是你的網(wǎng)站關(guān)鍵詞排名同由這個(gè)公式而決定的,文章得分=TF-IDF算法得分+鏈接得分,目前各大搜索引擎都在引用TF-IDF算法!
看到這里大家心中也許會(huì)有一個(gè)疑問(wèn),百度真的引用了TF-IDF算法嗎?下面接著往下看。
首先,百度在用TFIDF算法
實(shí)證,大家可以在網(wǎng)上查看百度專利文檔《CN102737018A-基于非線性統(tǒng)一權(quán)值對(duì)檢索結(jié)果進(jìn)行排序的方法及裝置-公開(kāi)》,百度搜索算法更新升級(jí)非常快,但TF-IDF算法作為搜索引擎的核心算法之一始終是沒(méi)有變的。

其次,GOOGLE也用TFIDF算法
全球搜索引擎google也在官方文檔中承認(rèn)引用了TF-IDF算法:原文鏈接:https://www.searchenginejournal.com/google-tf-idf/304361/

最后,TFI-DF得分占極高比重
搜索引擎使用TF-IDF作為對(duì)網(wǎng)頁(yè)內(nèi)容評(píng)判質(zhì)量的標(biāo)準(zhǔn),那么這個(gè)占比有多大呢?如今搜索引擎是按照這個(gè)方法進(jìn)行計(jì)算頁(yè)面得分的:score(頁(yè)面得分) = TF-IDF分 * x + 鏈接分 * y + 用戶體驗(yàn)分 * z(其中x+y+z=100%;);

2G左右谷歌搜索資料中,相關(guān)技術(shù)大咖做了相關(guān)預(yù)測(cè),預(yù)測(cè)TF-IDF分值百度占比約為40%左右,谷歌TF-IDF分值占比約50%左右,通過(guò)做黑帽SEO的朋友介紹,TF-IDF分值的權(quán)重值百度約占有20%,谷歌目前還不清楚。
用戶體驗(yàn)得分可以通過(guò)刷快排提高,百度占40%左右,Google無(wú)相關(guān)公示文檔。
所以說(shuō)在國(guó)內(nèi)做SEO:排名得分=40%內(nèi)容質(zhì)量(TFIDF)+40%用戶體驗(yàn)分(快排)+20%的鏈接分(域名+外鏈),TFIDF重要程度就可想而知了。
摩天樓使用了TF-IDF Plus
黑帽百科之前拿了幾個(gè)站做了下試驗(yàn),都使用了TF-IDF算法的基本公式,很多關(guān)鍵詞都沒(méi)有都上首頁(yè),后來(lái)經(jīng)過(guò)大咖的指點(diǎn),網(wǎng)站使用了TF-IDF算法的升級(jí)版本BM25算法,主要是調(diào)整了文檔長(zhǎng)度、關(guān)鍵詞權(quán)重等參數(shù)。
TF-IDF算法的升級(jí)版本BM25算法公式中的k參數(shù)排序得分基本也與谷歌搜索排序一致,而國(guó)內(nèi)的百度搜索引擎由于人工干擾因素太多而無(wú)法驗(yàn)證,不過(guò)通過(guò)相關(guān)實(shí)例驗(yàn)證,K參數(shù)的取值也八九不離十。

如何使用TF-IDF算法提高得分
1、寫內(nèi)容
確定好核心關(guān)鍵詞,再確定幾個(gè)長(zhǎng)尾關(guān)鍵詞,再把網(wǎng)站標(biāo)題確定好,然后再按照網(wǎng)站標(biāo)題寫好描述內(nèi)容,白帽SEO站長(zhǎng)進(jìn)行內(nèi)容原創(chuàng),黑帽SEO同學(xué)采集內(nèi)容做拼湊…

2、通過(guò)摩天樓SEO內(nèi)容助手評(píng)分
利用摩天樓SEO內(nèi)容助手從5個(gè)維度對(duì)你網(wǎng)站標(biāo)題做評(píng)測(cè),跟蹤不同相關(guān)的關(guān)鍵詞,幫你測(cè)試在同行業(yè)中你的網(wǎng)站得分,這些都對(duì)提升你網(wǎng)站排名是非常有作用的。

3、重新優(yōu)化內(nèi)容
摩天樓SEO內(nèi)容助手工具通過(guò)分析你網(wǎng)站后,會(huì)提示你要減少哪些關(guān)鍵詞和要增加哪些關(guān)鍵詞,然后你按照這些提示去做就行了,步驟過(guò)程雖然會(huì)有點(diǎn)枯燥無(wú)味,對(duì)已經(jīng)成功了多個(gè)案例了。

4、再次通過(guò)摩天樓SEO內(nèi)容助手評(píng)分
SEO優(yōu)化就是一個(gè)反復(fù)驗(yàn)證的過(guò)程,如果你的網(wǎng)站將TOP50左右的相關(guān)關(guān)鍵詞都覆蓋了,那么你的網(wǎng)站內(nèi)容基本上就可以算得上是全網(wǎng)TOP2了,然后再調(diào)整下詞頻,調(diào)整到TOP10,就可以稱得上是全網(wǎng)第一了。

摩天樓真的對(duì)SEO有提升嗎?
1、開(kāi)發(fā)過(guò)程驗(yàn)證
在發(fā)表這篇文章的時(shí)候,TF-IDF算法測(cè)試已經(jīng)超過(guò)一年了,然后再研究了百度、好搜、神馬的相關(guān)搜索算法專利,特別是百度,也正是通過(guò)百度搜索算法專利那里得知了TF-IDF算法。
后來(lái)通過(guò)百萬(wàn)級(jí)數(shù)據(jù)的驗(yàn)證,準(zhǔn)備了100個(gè)自然搜索詞,驗(yàn)證相關(guān)性算法預(yù)測(cè)排名與實(shí)際排名重合度(反面交叉驗(yàn)證),數(shù)據(jù)基本符合預(yù)期。
2、成功案列驗(yàn)證
后來(lái)驗(yàn)證了摩天樓SEO內(nèi)容助手工具確實(shí)對(duì)網(wǎng)站優(yōu)化有效,而且相關(guān)案例也得到了驗(yàn)證,通過(guò)搜索引擎結(jié)果交叉驗(yàn)證也證明了摩天樓SEO工具不僅有效而且還很準(zhǔn)。
3、國(guó)外TFIDF工具很流行
目前國(guó)內(nèi)SEO相關(guān)培訓(xùn)的課程中都沒(méi)有涉術(shù)TF-IDF算法的深度解析,國(guó)外的技術(shù)大牛們則已經(jīng)通過(guò)了多次實(shí)驗(yàn)的驗(yàn)證,我們都知道國(guó)內(nèi)的搜索引擎一直在跟國(guó)外搜索引擎著google在學(xué),如果TF-IDF算法應(yīng)用在了谷歌上,那么百度應(yīng)該也使用了TF-IDF算法。

國(guó)外SEO大神強(qiáng)推TF*IDF

最后想說(shuō)的
最后想說(shuō)的是摩天樓SEO內(nèi)容助手工具并不是一款黑帽SEO工具,但如果配合的黑帽技術(shù)可能會(huì)得到更好的效果,其次是大部分站長(zhǎng)的心態(tài)一直沒(méi)有擺正,都想通過(guò)什么牛B技術(shù)快速將網(wǎng)站排名做上去,但如果你不產(chǎn)生優(yōu)質(zhì)內(nèi)容,搜索引擎肯定是會(huì)給你好的排名的,如果這個(gè)搜索引擎給了你網(wǎng)站關(guān)鍵詞好的排名,那么這個(gè)搜索引擎也差不多要玩完了。
因此,黑帽百科建議同行們一定要靜下心堅(jiān)持,慢慢的做內(nèi)容,不要總想著能一步登天。
摩天樓SEO內(nèi)容助手工具目前來(lái)說(shuō)還并不是一款完美的工具,但確實(shí)目前還算是一款不錯(cuò)的SEO工具,大家可以繼續(xù)支持。
