濰坊市玉清街與虞河路交匯處錦繡園
您的當前位置:易迅網絡公司->山東SEO->山東網站優化->瀏覽文章
山東網站優化

百度排名算法之詞頻位置加權統計法

標簽:百度,排名,算法,之詞,詞頻,位置,加權,統計,統計法  2020年02月05日  點擊208

詞頻位置加權統計法可稱作向量空間模型中相似度的計算過程,一部分搜索引擎都以查詢詞在文檔中的詞頻和位置作為文檔權值的判定依據,行使詞頻位置加權算法來衡量文檔的相干度。


某個詞在網頁或者文檔中出現的次數越多,它所能代表文檔主題內容的能力就越強,其作為索引項的代表性也就越強獲得的權值就會比較大。當它與查詢詞進行對照時,它索引的文檔與搜索請求的相干度的值就越大。詞頻不能完全代表該算法的精髓,某一個詞出如今文檔中的位置也影響主題詞的產生,同時也會影響詞的權值的計算。


網頁的位置結構也許包含以下幾種:鏈接地址標簽、題目標簽、Meta 關鍵詞標簽,在這些位置選詞并按詞頻計算權值時,主題詞的位置是在文章前幾段、文章題目、段首等位置時,它的權值就會相對較大,大部分搜索引擎在計算相干度時采用詞頻位置加權算法,然而在實現細節上會有許多不同。


在計算某一個文檔的相干度時網站價格,詞與詞之間的關系和詞間的相對位置也是一個必要參考的緊張因素之一,網頁中詞與詞之間的位置越近則會表現在排序效果的前面。


一個比較正確的方法就是采用詞頻和詞位置計算相干度的算法,它被普遍的應用在搜索引擎當中,也是發展比較成型的算法,很多搜索引擎將它作為計算文檔相干度排序的基礎。


然而這種算法的一個缺陷比較容易被人行使,例如網頁編輯者可以把當前比較熱門的關鍵詞也故意的編到網頁當中,如許可以在搜索引擎中獲得很好的排名。不僅沒有客觀性而且正確性也受到很大影響,用戶的利益也受到了損害。超鏈分析算法恰恰能避免如許的瑕玷,它是計算相干度的另一種緊張的方法。


老人麻将连连看下载