PageRank算法




在諸如Google一類搜索引擎中使用PageRank(PR值)來量化網(wǎng)站的排名,PageRank是一系列算法,能對(duì)每個(gè)網(wǎng)頁給出一個(gè)數(shù)值,表示網(wǎng)頁在互聯(lián)網(wǎng)中的重要性[5] 。PageRank的具體細(xì)節(jié)還沒有公開,該算法最早出現(xiàn)在其創(chuàng)始人的一篇論文中,是利用頁面相關(guān)性得分(RelevancyScore)+頁面等級(jí)得分(PageRank)來決定頁面的相關(guān)性與重要性。該算法首先找到所有與查詢關(guān)鍵詞相匹配的網(wǎng)頁,然后根據(jù)頁面因素等進(jìn)行排名,最后通過PageRank得分調(diào)整網(wǎng)站排名結(jié)果[5] 。 假設(shè)網(wǎng)頁A有網(wǎng)頁t1,t2,····,tn的鏈接指向它,則PageRank的原始公式為:PR(A)=(1-d)+d(PR(t1)/C(t1)+····+PR(tn)/C(tn))其中d為阻尼系數(shù)(dampingfactor),一般設(shè)為0.85;PR(A)是網(wǎng)頁A的網(wǎng)頁級(jí)別 (PageRank);C(tn)是網(wǎng)頁tn的指向外部鏈接的總數(shù)量。公式可描述為:A網(wǎng)頁的PR值等于鏈向該頁面的所有鏈接頁面的PR值分別除以各自的外部鏈接數(shù)量的總和,再加上(1-d)。