此算法被用作googlePR算法的一部分
假設一個概率q:為用戶進入一個隨機抽取的網頁的概率 (取值為0.15)
1-q: 為用戶進入當前網頁后點當前網頁超鏈接的概率
進一步假設用戶不回溯先前訪問的網頁,這個過程可以通過構造馬爾可夫鏈來實現。于是每個訪問的網頁的概率就可以算出來。
設C(a)為a網頁包含的超鏈接數量,也就是outing link .
設p1 到pn 為指向網頁a的網頁標識 。
于是網頁a的PR值為:
PR(a)=q+ (1-q){ 西格瑪i從1到n [PR(Pi)/C(Pi)] }
通過公式可以看出C(Pi)的值是已知的,也就是說前人已經算好了 。
網頁的PR值作用是:Crawling可以根據網頁的PR值去抓優質的網頁。
所以可以看出網頁設計者應該設計描述性強的網頁標題,頭信息,原數據,和好的超鏈接。
這是我翻譯的一篇文獻的一部分,希望能給大家提供一些幫助。
假設一個概率q:為用戶進入一個隨機抽取的網頁的概率 (取值為0.15)
1-q: 為用戶進入當前網頁后點當前網頁超鏈接的概率
進一步假設用戶不回溯先前訪問的網頁,這個過程可以通過構造馬爾可夫鏈來實現。于是每個訪問的網頁的概率就可以算出來。
設C(a)為a網頁包含的超鏈接數量,也就是outing link .
設p1 到pn 為指向網頁a的網頁標識 。
于是網頁a的PR值為:
PR(a)=q+ (1-q){ 西格瑪i從1到n [PR(Pi)/C(Pi)] }
通過公式可以看出C(Pi)的值是已知的,也就是說前人已經算好了 。
網頁的PR值作用是:Crawling可以根據網頁的PR值去抓優質的網頁。
所以可以看出網頁設計者應該設計描述性強的網頁標題,頭信息,原數據,和好的超鏈接。
這是我翻譯的一篇文獻的一部分,希望能給大家提供一些幫助。