久草中文在线观看_久久精品中文字幕一区_亚洲日本欧美日韩中文字幕_熟妇人妻无乱码中文字幕真矢织江

或者

搜索引擎的3種核心算法

作者:wangj 瀏覽:1630 發(fā)布時(shí)間:2016-05-24
編輯 分享 評(píng)論 0

外鏈?zhǔn)撬阉饕嫠惴ㄖ校袛嗑W(wǎng)站權(quán)重高低的重要指標(biāo),當(dāng)用戶在搜索框中輸入關(guān)鍵時(shí),搜索引擎面對(duì)大量擁有相同內(nèi)容的網(wǎng)頁,首先需要解決的就是,通過哪些 參數(shù)覺得網(wǎng)頁排名的高低。今天,筆者就簡(jiǎn)單介紹外鏈建設(shè)中,比較有名的核心算法:PageRank算法、Hilltop算法、Direct Hit 算法。


1
算法一、PageRank算法


1998年,Sergey Brin和Lawrence Page提出了PageRank算法。該算法基于“從許多優(yōu)質(zhì)的網(wǎng)頁鏈接過來的網(wǎng)頁,必定還是優(yōu)質(zhì)網(wǎng)頁”的回歸關(guān)系,來判定網(wǎng)頁的重要性。該算法認(rèn)為從網(wǎng) 頁A導(dǎo)向網(wǎng)頁B的鏈接可以看作是頁面A對(duì)頁面B的支持投票,根據(jù)這個(gè)投票數(shù)來判斷頁面的重要性。當(dāng)然,不僅僅只看投票數(shù),還要對(duì)投票的頁面進(jìn)行重要性分 析,越是重要的頁面所投票的評(píng)價(jià)也就越高。根據(jù)這樣的分析,得到了高評(píng)價(jià)的重要頁面會(huì)被給予較高的PageRank值,在檢索結(jié)果內(nèi)的名次也會(huì)提高。 PageRank是基于對(duì)“使用復(fù)雜的算法而得到的鏈接構(gòu)造” 的分析,從而得出的各網(wǎng)頁本身的特性。


分 析:PageRank算法的優(yōu)點(diǎn)在于它對(duì)互聯(lián)網(wǎng)上的網(wǎng)頁給出了一個(gè)全局的重要性排序,并且算法的計(jì)算過程是可以離線完成的,這樣有利于迅速響應(yīng)用戶的請(qǐng) 求。不過,其缺點(diǎn)在于主題無關(guān)性,沒有區(qū)分頁面內(nèi)的導(dǎo)航鏈接、廣告鏈接和功能鏈接等,容易對(duì)廣告頁面有過高評(píng)價(jià);另外,PageRank算法的另一弊端 是,舊的頁面等級(jí)會(huì)比新頁面高,因?yàn)樾马撁妫词故欠浅:玫捻撁妫膊粫?huì)有很多鏈接,除非他是一個(gè)站點(diǎn)的子站點(diǎn)。這就是PageRank需要多項(xiàng)算法結(jié)合 的原因。


2
算法二、Hilltop算法


HillTop,是一項(xiàng)搜索引擎 結(jié)果排序的專利,是Google的一個(gè)工程師Bharat在2001年獲得的專利。HillTop算法的指導(dǎo)思想和PageRank是一致的,即都通過反 向鏈接的數(shù)量和質(zhì)量來確定搜索結(jié)果的排序權(quán)重。但HillTop認(rèn)為只計(jì)算來自具有相同主題的相關(guān)文檔鏈接對(duì)于搜索者的價(jià)值會(huì)更大,即主題相關(guān)網(wǎng)頁之間的 鏈接對(duì)于權(quán)重計(jì)算的貢獻(xiàn)比主題不相關(guān)的鏈接價(jià)值要更高。在1999-2000年,當(dāng)這個(gè)算法被Bharat與其他Google開發(fā)人員開發(fā)出來的時(shí)候,他 們稱這種對(duì)主題有影響的文檔為“專家”文檔,而只有從這些專家文檔頁面到目標(biāo)文檔的鏈接決定了被鏈接網(wǎng)頁“權(quán)重得分”的主要部分。


Hilltop算法的過程:首先計(jì)算查詢主題最相關(guān)的“專家”資源列表;其次在選中的“專家”集中識(shí)別相關(guān)的鏈接,并追蹤它們以識(shí)別相關(guān)的網(wǎng)頁目標(biāo);然 后將目標(biāo)根據(jù)非關(guān)聯(lián)的指向它們的“專家”數(shù)量和相關(guān)性排序。由此,目標(biāo)網(wǎng)頁的得分反映了關(guān)于查詢主題的最中立的專家的集體觀點(diǎn)。如果這樣的專家池不存 在,Hilltop不會(huì)給出結(jié)果。


從Hilltop算法過程可見,該算法包括兩個(gè)主要的方面:尋找專家;目標(biāo)排序。通過對(duì)搜索引擎抓取的網(wǎng)頁進(jìn)行預(yù)處理,找出專家頁面。對(duì)于一個(gè)關(guān)鍵詞的查詢,首先在專家中查找,并排序返回結(jié)果。


權(quán)威頁面是對(duì)于一個(gè)查詢主題來說最好的專家指向的頁面。專家也有可能在更寬泛的領(lǐng)域或其它領(lǐng)域的主題上也是專家。在專家頁面中只有一部分鏈接與主題相關(guān)。因此,把查詢主題的專家中相關(guān)的外向鏈接合并,以找到查詢主題相關(guān)頁面高度認(rèn)可的頁面。


從排名在前的匹配專家頁面和相聯(lián)系的匹配信息中選擇專家頁面中一個(gè)超鏈接的子集。尤其選擇那些與所有的查詢相關(guān)的鏈接。基于這些選中的鏈接找出一個(gè)它們 的目標(biāo)子集作為查詢主題最相關(guān)的網(wǎng)頁。這個(gè)目標(biāo)子集包含至少被兩個(gè)非親屬的專家頁面鏈接到的網(wǎng)頁。目標(biāo)集根據(jù)指向它們的專家的綜合成績(jī)來排序。


Hilltop在應(yīng)用中還存在一些不足。專家頁面的搜索和確定對(duì)算法起關(guān)鍵作用,專家頁面的質(zhì)量決定了算法的準(zhǔn)確性;而專家頁面的質(zhì)量和公平性在一定程 度上難以保證。Hiltop忽略了大多數(shù)非專家頁面的影響。在Hiltop的原型系統(tǒng)中,專家頁面只占到整個(gè)頁面的1.79%,不能全面代表整個(gè)互聯(lián)網(wǎng)。


Hiltop算法在無法得到足夠的專家頁面子集時(shí)(少于兩個(gè)專家頁面),返回為空,即Hiltop適合于對(duì)查詢排序進(jìn)行求精,而不能覆蓋。這意味著 Hilltop可以與某個(gè)頁面排序算法結(jié)合,提高精度,而不適合作為一個(gè)獨(dú)立的頁面排序算法。Hilltop中根據(jù)查詢主題從專家頁面集合中選取與主題相 關(guān)的子集也是在線運(yùn)行的,這與前面提到的HITS算法一樣會(huì)影響查詢響應(yīng)時(shí)間。隨著專家頁面集合的增大,算法的可伸縮性存在不足之處。


分析:HITS算法的優(yōu)點(diǎn)在于它能更好地描述互聯(lián)網(wǎng)的組織特點(diǎn),由于它只是對(duì)互聯(lián)網(wǎng)中的很小的一個(gè)子集進(jìn)行分析,所以它需要的迭代次數(shù)更少,收斂速度更快,減少了時(shí)間復(fù)雜度。


但HITS算法也存在如下缺點(diǎn):中心網(wǎng)頁之間的相互引用以增加其網(wǎng)頁評(píng)價(jià),當(dāng)一個(gè)網(wǎng)站上的多篇網(wǎng)頁指向一個(gè)相同的鏈接,或者一個(gè)網(wǎng)頁指向另一個(gè)網(wǎng)站上的多個(gè)文件時(shí)會(huì)引起評(píng)分的不正常增加,這會(huì)導(dǎo)致易受“垃圾鏈接”的影響;網(wǎng)頁中存在自動(dòng)生成的鏈接;


主題漂移,在鄰接圖中經(jīng)常包括一些和搜索主題無關(guān)的鏈接,如果這些鏈接自身也是中心網(wǎng)頁或權(quán)威網(wǎng)頁就會(huì)引起主題漂移:對(duì)于每個(gè)不同的查詢算法都需要重新運(yùn)行一次來獲取結(jié)果。這使得它不可能用于實(shí)時(shí)系統(tǒng),因?yàn)閷?duì)于上千萬次的并發(fā)查詢這樣的開銷實(shí)在太大。


3
算法三、Direct Hit


   算法與前面的算法相比,Ask Jeeves公司的Direct Hit算法是一種注重信息的質(zhì)量和用戶反饋的排序方法。它的基本思想是,搜索引擎將查詢的結(jié)果返回給用戶,并跟蹤用戶在檢索結(jié)果中的點(diǎn)擊。如果返回結(jié)果中 排名靠前的網(wǎng)頁被用戶點(diǎn)擊后,瀏覽時(shí)間較短,用戶又重新返回點(diǎn)擊其它的檢索結(jié)果,那么可以認(rèn)為其相關(guān)度較差,系統(tǒng)將降低該網(wǎng)頁的相關(guān)性。另一方面,如果網(wǎng) 頁被用戶點(diǎn)擊打開進(jìn)行瀏覽,并且瀏覽的時(shí)間較長(zhǎng),那么該網(wǎng)頁的受歡迎程度就高,相應(yīng)地,系統(tǒng)將增加該網(wǎng)頁的相關(guān)度。可以看出,在這種方法中,相關(guān)度在不停 地變化,對(duì)于同一個(gè)詞在不同的時(shí)間進(jìn)行檢索,得到結(jié)果集合的排序也有可能不同,它是一種動(dòng)態(tài)排序。


分析:該算法的優(yōu)點(diǎn)是能夠節(jié)省大量時(shí)間,因?yàn)橛脩糸喿x的是從搜索結(jié)果中篩選出來的更加符合要求的結(jié)果。同時(shí),這種算法直接融入用戶的反饋信息,能夠保證頁面的質(zhì)量。


然而,統(tǒng)計(jì)表明,Direct Hit算法只適合于檢索關(guān)鍵詞較少的情況,因?yàn)樗鼘?shí)際上并沒有進(jìn)行排序,而是一種篩選和抽取,在檢索數(shù)據(jù)庫很大、關(guān)鍵詞很多的時(shí)候,返回的搜索結(jié)果成千上 萬,用戶不可能一一審閱。因此,這種方式也不能作為主要的排序算法來使用,而是一種很好的輔助排序算法,目前在許多搜索引擎當(dāng)中仍然在使用。


其實(shí)對(duì)于網(wǎng)頁的搜索排名,都是多種算法綜合作用的結(jié)果,簡(jiǎn)單分析上面的三種算法,Pagerank可以給網(wǎng)站上的所有網(wǎng)頁給予一個(gè)重要性的排序,但是沒有針對(duì)性、相關(guān)性,而且現(xiàn)在PR值作弊已經(jīng)到了一個(gè)泛濫的地步,所以PR就網(wǎng)頁排名的重要性已經(jīng)大為下降;


Hilltop算法的提出,對(duì)于廣大站長(zhǎng)做外部鏈接建設(shè),將起到指導(dǎo)作用。在Hilltop算法中,每個(gè)領(lǐng)域都會(huì)有若干專家頁面,如果搜索相關(guān)關(guān)鍵詞,搜索引擎首先會(huì)從專家頁面查找,如果匹配度不夠,再?gòu)膶<翼撁骀溄拥南乱患?jí)頁面查找,以此類推。


   Direct Hit算法可以作為Hilltop和pagerank很好的補(bǔ)充,Direct Hit更多的是,考慮了用戶體驗(yàn)的影響,對(duì)搜索結(jié)果的質(zhì)量,進(jìn)行實(shí)時(shí)的更新,一個(gè)最符合搜索用戶要求的頁面,應(yīng)該是用戶從搜索框中點(diǎn)擊頁面鏈接開始,用戶 瀏覽網(wǎng)站超過一定時(shí)間,則被認(rèn)為結(jié)果頁面,更符合用戶搜索的要求,長(zhǎng)期有效的點(diǎn)擊,頁面在搜索引擎中排名,就會(huì)有相應(yīng)的提高。


 通過以上三種算法,就可以明白,無論是做外鏈還是網(wǎng)站內(nèi)容建設(shè),首先需要考慮的就是相關(guān)性,在外鏈建設(shè)中,要努力尋找主題相關(guān)中,權(quán)威度高的網(wǎng)站,軟 文、友情鏈接等,都可以看作是這些網(wǎng)站,對(duì)你的支持,同時(shí),注意網(wǎng)站的跳出率和瀏覽時(shí)間,時(shí)刻反饋用戶數(shù)據(jù),對(duì)一些重點(diǎn)頁面,用戶點(diǎn)擊量較高的頁面,做好 相關(guān)性推薦,引導(dǎo)用戶點(diǎn)擊更多的頁面。


詞條統(tǒng)計(jì)

  • 瀏覽次數(shù):1630
  • 編輯次數(shù):0次歷史版本
  • 最近更新:2016-05-24
  • 創(chuàng)建者:wangj
  • 相關(guān)詞條

    相關(guān)問答

    相關(guān)百科

    相關(guān)資訊

    久草中文在线观看_久久精品中文字幕一区_亚洲日本欧美日韩中文字幕_熟妇人妻无乱码中文字幕真矢织江
    <code id="6mcsu"></code>
    <li id="6mcsu"></li>
    <li id="6mcsu"><dl id="6mcsu"></dl></li>
  • <code id="6mcsu"><tr id="6mcsu"></tr></code>
    色偷偷一区二区三区| 91黄色免费观看| 国产精品久久毛片a| 99精品视频一区| 亚洲成va人在线观看| 欧美一区三区二区| 国产精品99久久久久久久女警| 日本一区二区成人在线| 91亚洲精品久久久蜜桃网站| 亚洲午夜精品久久久久久久久| 日韩视频免费直播| 国产suv精品一区二区883| 亚洲女同女同女同女同女同69| 欧美三级中文字幕在线观看| 精品一区精品二区高清| 国产精品你懂的在线| 欧美综合天天夜夜久久| 欧美日韩在线免费视频| 日韩av电影一区| 久久亚洲免费视频| 91啪九色porn原创视频在线观看| 日韩电影在线免费看| 国产亚洲一本大道中文在线| 色94色欧美sute亚洲线路一ni| 天天av天天翘天天综合网| 2024国产精品视频| 91久久奴性调教| 极品尤物av久久免费看| 亚洲人亚洲人成电影网站色| 91精品国产一区二区人妖| 国产99久久久国产精品| 午夜伊人狠狠久久| 国产午夜一区二区三区| 欧美色欧美亚洲另类二区| 国产一区二区不卡在线| 一区二区国产视频| 精品国产一区二区三区久久久蜜月 | 欧美aⅴ一区二区三区视频| 中文字幕第一区二区| 欧美日韩在线不卡| 高清国产一区二区三区| 视频一区二区国产| 国产精品国产三级国产三级人妇| 欧美人动与zoxxxx乱| 成人黄色片在线观看| 奇米一区二区三区| 亚洲欧美日韩综合aⅴ视频| 精品久久久久久久人人人人传媒| 日本乱人伦aⅴ精品| 国产一区二区免费在线| 午夜精品一区二区三区电影天堂| 中文字幕精品在线不卡| 日韩免费成人网| 欧美性感一区二区三区| 国产91丝袜在线观看| 麻豆精品国产91久久久久久| 一区二区在线观看免费视频播放| 国产女主播视频一区二区| 在线成人小视频| 在线观看av不卡| 成人爱爱电影网址| 国产一区二区三区蝌蚪| 三级一区在线视频先锋| 一区二区三区不卡在线观看| 亚洲国产高清在线观看视频| 欧美变态凌虐bdsm| 91精品啪在线观看国产60岁| 色综合久久88色综合天天6| 丁香激情综合国产| 黑人巨大精品欧美一区| 香蕉乱码成人久久天堂爱免费| 亚洲色图欧美在线| 欧美激情一区三区| 精品精品欲导航| 91精品黄色片免费大全| 欧洲人成人精品| 色诱视频网站一区| 成人免费观看视频| 国产精品一级在线| 免费在线观看一区| 日韩高清欧美激情| 天堂蜜桃一区二区三区| 香蕉av福利精品导航| 亚洲综合视频在线| 亚洲手机成人高清视频| 中文字幕一区二区视频| 亚洲国产精品成人久久综合一区| 日韩高清在线观看| 午夜精品aaa| 亚洲成年人网站在线观看| 亚洲自拍偷拍综合| 一区二区三区国产精品| 玉足女爽爽91| 一区二区三区不卡视频| 亚洲美女少妇撒尿| 亚洲欧美日韩国产综合在线| 成人免费在线视频| 一区精品在线播放| 亚洲欧美日韩国产中文在线| 亚洲色图在线播放| 亚洲精选在线视频| 一区二区三区自拍| 亚洲高清免费在线| 性感美女极品91精品| 青青草原综合久久大伊人精品优势| 日韩国产高清在线| 麻豆精品精品国产自在97香蕉| 久久91精品国产91久久小草| 激情文学综合网| 国产成人精品综合在线观看| 丁香激情综合五月| 91亚洲精华国产精华精华液| 色综合天天综合网天天狠天天| 色视频成人在线观看免| 在线免费观看日本一区| 91福利精品视频| 欧美区视频在线观看| 欧美一区二区三区精品| 26uuu精品一区二区| 国产欧美精品一区aⅴ影院| 国产精品欧美经典| 中文字幕日本不卡| 夜夜嗨av一区二区三区中文字幕| 亚洲h在线观看| 久久99热狠狠色一区二区| 国产精品99久久久久久久女警| 9久草视频在线视频精品| 色婷婷狠狠综合| 欧美一区二区三区日韩视频| 久久夜色精品国产噜噜av| 国产精品午夜春色av| 亚洲乱码日产精品bd| 日韩成人伦理电影在线观看| 激情小说亚洲一区| voyeur盗摄精品| 欧美视频一区二| 精品日韩在线观看| 国产精品护士白丝一区av| 亚洲自拍欧美精品| 免费成人在线视频观看| 成人性生交大合| 欧美三级日韩三级| 精品国产伦一区二区三区免费| 中文字幕一区二区三区乱码在线| 亚洲国产一区在线观看| 国产一区二区网址| 91美女福利视频| 日韩欧美国产不卡| 亚洲视频你懂的| 蜜芽一区二区三区| 波多野结衣精品在线| 欧美另类久久久品| 久久久美女艺术照精彩视频福利播放| 亚洲欧洲精品天堂一级| 日本伊人精品一区二区三区观看方式| 国产福利一区二区三区视频在线| 在线亚洲欧美专区二区| 精品国产电影一区二区| 亚洲乱码国产乱码精品精的特点| 偷窥国产亚洲免费视频| 国产成人啪免费观看软件| 欧美性受极品xxxx喷水| 国产网红主播福利一区二区| 亚洲午夜激情网站| 国产成人小视频| 91精品在线一区二区| av综合在线播放| 5858s免费视频成人| 国产精品久久午夜夜伦鲁鲁| 蜜乳av一区二区| 91精品福利在线| 久久久精品黄色| 日韩制服丝袜先锋影音| yourporn久久国产精品| 日韩一级免费一区| 有码一区二区三区| 国产精品系列在线播放| 91精品欧美综合在线观看最新| 亚洲欧洲av在线| 国产一区二区三区免费观看| 欧美男人的天堂一二区| 中文字幕色av一区二区三区| 九九热在线视频观看这里只有精品| 日本道色综合久久| 国产人成亚洲第一网站在线播放| 日韩精品1区2区3区| 色综合久久天天| 中文av一区特黄| 国内精品自线一区二区三区视频| 欧美日本一区二区三区| 亚洲人精品一区| 成人黄色小视频在线观看| 精品盗摄一区二区三区| 婷婷久久综合九色国产成人 | 亚洲婷婷在线视频| 国产一区美女在线| 欧美一区二区三区在线观看视频| 亚洲与欧洲av电影| 91麻豆精东视频| 国产精品久久久久影院亚瑟|