久草中文在线观看_久久精品中文字幕一区_亚洲日本欧美日韩中文字幕_熟妇人妻无乱码中文字幕真矢织江

或者

淺談搜索引擎的核心算法

作者:一只德德牛(團(tuán)隊-快排) 瀏覽:65 發(fā)布時間:2017-08-30
分享 評論 0

外鏈?zhǔn)撬阉饕嫠惴ㄖ校袛嗑W(wǎng)站權(quán)重高低的重要指標(biāo),當(dāng)用戶在搜索框中輸入關(guān)鍵時,搜索引擎面對大量擁有相同內(nèi)容的網(wǎng)頁,首先需要解決的就是,通過哪些參數(shù)覺得網(wǎng)頁排名的高低。今天,筆者就簡單介紹外鏈建設(shè)中,比較有名的核心算法:PageRank算法、Hilltop算法、Direct Hit 算法。

  第一種算法、PageRank算法

  1998年,Sergey Brin和Lawrence Page提出了PageRank算法。該算法基于“從許多優(yōu)質(zhì)的網(wǎng)頁鏈接過來的網(wǎng)頁,必定還是優(yōu)質(zhì)網(wǎng)頁”的回歸關(guān)系,來判定網(wǎng)頁的重要性。該算法認(rèn)為從網(wǎng)頁A導(dǎo)向網(wǎng)頁B的鏈接可以看作是頁面A對頁面B的支持投票,根據(jù)這個投票數(shù)來判斷頁面的重要性。當(dāng)然,不僅僅只看投票數(shù),還要對投票的頁面進(jìn)行重要性分析,越是重要的頁面所投票的評價也就越高。根據(jù)這樣的分析,得到了高評價的重要頁面會被給予較高的PageRank值,在檢索結(jié)果內(nèi)的名次也會提高。PageRank是基于對“使用復(fù)雜的算法而得到的鏈接構(gòu)造” 的分析,從而得出的各網(wǎng)頁本身的特性。

  分析:PageRank算法的優(yōu)點(diǎn)在于它對互聯(lián)網(wǎng)上的網(wǎng)頁給出了一個全局的重要性排序,并且算法的計算過程是可以離線完成的,這樣有利于迅速響應(yīng)用戶的請求。不過,其缺點(diǎn)在于主題無關(guān)性,沒有區(qū)分頁面內(nèi)的導(dǎo)航鏈接、廣告鏈接和功能鏈接等,容易對廣告頁面有過高評價;另外,PageRank算法的另一弊端是,舊的頁面等級會比新頁面高,因為新頁面,即使是非常好的頁面,也不會有很多鏈接,除非他是一個站點(diǎn)的子站點(diǎn)。這就是PageRank需要多項算法結(jié)合的原因。

  第二種算法、Hilltop算法

  HillTop,是一項搜索引擎結(jié)果排序的專利,是Google的一個工程師Bharat在2001年獲得的專利。HillTop算法的指導(dǎo)思想和PageRank是一致的,即都通過反向鏈接的數(shù)量和質(zhì)量來確定搜索結(jié)果的排序權(quán)重。但HillTop認(rèn)為只計算來自具有相同主題的相關(guān)文檔鏈接對于搜索者的價值會更大,即主題相關(guān)網(wǎng)頁之間的鏈接對于權(quán)重計算的貢獻(xiàn)比主題不相關(guān)的鏈接價值要更高。在1999-2000年,當(dāng)這個算法被Bharat與其他Google開發(fā)人員開發(fā)出來的時候,他們稱這種對主題有影響的文檔為“專家”文檔,而只有從這些專家文檔頁面到目標(biāo)文檔的鏈接決定了被鏈接網(wǎng)頁“權(quán)重得分”的主要部分。

  Hilltop算法的過程:首先計算查詢主題最相關(guān)的“專家”資源列表;其次在選中的“專家”集中識別相關(guān)的鏈接,并追蹤它們以識別相關(guān)的網(wǎng)頁目標(biāo);然后將目標(biāo)根據(jù)非關(guān)聯(lián)的指向它們的“專家”數(shù)量和相關(guān)性排序。由此,目標(biāo)網(wǎng)頁的得分反映了關(guān)于查詢主題的最中立的專家的集體觀點(diǎn)。如果這樣的專家池不存在,Hilltop不會給出結(jié)果。

  從Hilltop算法過程可見,該算法包括兩個主要的方面:尋找專家;目標(biāo)排序。通過對搜索引擎抓取的網(wǎng)頁進(jìn)行預(yù)處理,找出專家頁面。對于一個關(guān)鍵詞的查詢,首先在專家中查找,并排序返回結(jié)果。

  權(quán)威頁面是對于一個查詢主題來說最好的專家指向的頁面。專家也有可能在更寬泛的領(lǐng)域或其它領(lǐng)域的主題上也是專家。在專家頁面中只有一部分鏈接與主題相關(guān)。因此,把查詢主題的專家中相關(guān)的外向鏈接合并,以找到查詢主題相關(guān)頁面高度認(rèn)可的頁面。

  從排名在前的匹配專家頁面和相聯(lián)系的匹配信息中選擇專家頁面中一個超鏈接的子集。尤其選擇那些與所有的查詢相關(guān)的鏈接。基于這些選中的鏈接找出一個它們的目標(biāo)子集作為查詢主題最相關(guān)的網(wǎng)頁。這個目標(biāo)子集包含至少被兩個非親屬的專家頁面鏈接到的網(wǎng)頁。目標(biāo)集根據(jù)指向它們的專家的綜合成績來排序。

  Hilltop在應(yīng)用中還存在一些不足。專家頁面的搜索和確定對算法起關(guān)鍵作用,專家頁面的質(zhì)量決定了算法的準(zhǔn)確性;而專家頁面的質(zhì)量和公平性在一定程度上難以保證。Hiltop忽略了大多數(shù)非專家頁面的影響。在Hiltop的原型系統(tǒng)中,專家頁面只占到整個頁面的1.79%,不能全面代表整個互聯(lián)網(wǎng)。

  Hiltop算法在無法得到足夠的專家頁面子集時(少于兩個專家頁面),返回為空,即Hiltop適合于對查詢排序進(jìn)行求精,而不能覆蓋。這意味著Hilltop可以與某個頁面排序算法結(jié)合,提高精度,而不適合作為一個獨(dú)立的頁面排序算法。Hilltop中根據(jù)查詢主題從專家頁面集合中選取與主題相關(guān)的子集也是在線運(yùn)行的,這與前面提到的HITS算法一樣會影響查詢響應(yīng)時間。隨著專家頁面集合的增大,算法的可伸縮性存在不足之處。

  分析:HITS算法的優(yōu)點(diǎn)在于它能更好地描述互聯(lián)網(wǎng)的組織特點(diǎn),由于它只是對互聯(lián)網(wǎng)中的很小的一個子集進(jìn)行分析,所以它需要的迭代次數(shù)更少,收斂速度更快,減少了時間復(fù)雜度。

  但HITS算法也存在如下缺點(diǎn):中心網(wǎng)頁之間的相互引用以增加其網(wǎng)頁評價,當(dāng)一個網(wǎng)站上的多篇網(wǎng)頁指向一個相同的鏈接,或者一個網(wǎng)頁指向另一個網(wǎng)站上的多個文件時會引起評分的不正常增加,這會導(dǎo)致易受“垃圾鏈接”的影響;網(wǎng)頁中存在自動生成的鏈接;

  主題漂移,在鄰接圖中經(jīng)常包括一些和搜索主題無關(guān)的鏈接,如果這些鏈接自身也是中心網(wǎng)頁或權(quán)威網(wǎng)頁就會引起主題漂移:對于每個不同的查詢算法都需要重新運(yùn)行一次來獲取結(jié)果。這使得它不可能用于實時系統(tǒng),因為對于上千萬次的并發(fā)查詢這樣的開銷實在太大。

  第三種算法、Direct Hit 算法

  與前面的算法相比,Ask Jeeves公司的Direct Hit算法是一種注重信息的質(zhì)量和用戶反饋的排序方法。它的基本思想是,搜索引擎將查詢的結(jié)果返回給用戶,并跟蹤用戶在檢索結(jié)果中的點(diǎn)擊。如果返回結(jié)果中排名靠前的網(wǎng)頁被用戶點(diǎn)擊后,瀏覽時間較短,用戶又重新返回點(diǎn)擊其它的檢索結(jié)果,那么可以認(rèn)為其相關(guān)度較差,系統(tǒng)將降低該網(wǎng)頁的相關(guān)性。另一方面,如果網(wǎng)頁被用戶點(diǎn)擊打開進(jìn)行瀏覽,并且瀏覽的時間較長,那么該網(wǎng)頁的受歡迎程度就高,相應(yīng)地,系統(tǒng)將增加該網(wǎng)頁的相關(guān)度。可以看出,在這種方法中,相關(guān)度在不停地變化,對于同一個詞在不同的時間進(jìn)行檢索,得到結(jié)果集合的排序也有可能不同,它是一種動態(tài)排序。

  分析:該算法的優(yōu)點(diǎn)是能夠節(jié)省大量時間,因為用戶閱讀的是從搜索結(jié)果中篩選出來的更加符合要求的結(jié)果。同時,這種算法直接融入用戶的反饋信息,能夠保證頁面的質(zhì)量。

  然而,統(tǒng)計表明,Direct Hit算法只適合于檢索關(guān)鍵詞較少的情況,因為它實際上并沒有進(jìn)行排序,而是一種篩選和抽取,在檢索數(shù)據(jù)庫很大、關(guān)鍵詞很多的時候,返回的搜索結(jié)果成千上萬,用戶不可能一一審閱。因此,這種方式也不能作為主要的排序算法來使用,而是一種很好的輔助排序算法,目前在許多搜索引擎當(dāng)中仍然在使用。

  其實對于網(wǎng)頁的搜索排名,都是多種算法綜合作用的結(jié)果,簡單分析上面的三種算法,Pagerank可以給網(wǎng)站上的所有網(wǎng)頁給予一個重要性的排序,但是沒有針對性、相關(guān)性,而且現(xiàn)在PR值作弊已經(jīng)到了一個泛濫的地步,所以PR就網(wǎng)頁排名的重要性已經(jīng)大為下降;

  Hilltop算法的提出,對于廣大站長做外部鏈接建設(shè),將起到指導(dǎo)作用。在Hilltop算法中,每個領(lǐng)域都會有若干專家頁面,如果搜索相關(guān)關(guān)鍵詞,搜索引擎首先會從專家頁面查找,如果匹配度不夠,再從專家頁面鏈接的下一級頁面查找,以此類推。

  Direct Hit算法可以作為Hilltop和pagerank很好的補(bǔ)充,Direct Hit更多的是,考慮了用戶體驗的影響,對搜索結(jié)果的質(zhì)量,進(jìn)行實時的更新,一個最符合搜索用戶要求的頁面,應(yīng)該是用戶從搜索框中點(diǎn)擊頁面鏈接開始,用戶瀏覽網(wǎng)站超過一定時間,則被認(rèn)為結(jié)果頁面,更符合用戶搜索的要求,長期有效的點(diǎn)擊,頁面在搜索引擎中排名,就會有相應(yīng)的提高。

  通過以上三種算法,就可以明白,無論是做外鏈還是網(wǎng)站內(nèi)容建設(shè),首先需要考慮的就是相關(guān)性,在外鏈建設(shè)中,要努力尋找主題相關(guān)中,權(quán)威度高的網(wǎng)站,軟文、友情鏈接等,都可以看作是這些網(wǎng)站,對你的支持,同時,注意網(wǎng)站的跳出率和瀏覽時間,時刻反饋用戶數(shù)據(jù),對一些重點(diǎn)頁面,用戶點(diǎn)擊量較高的頁面,做好相關(guān)性推薦,引導(dǎo)用戶點(diǎn)擊更多的頁面。


久草中文在线观看_久久精品中文字幕一区_亚洲日本欧美日韩中文字幕_熟妇人妻无乱码中文字幕真矢织江
<code id="6mcsu"></code>
<li id="6mcsu"></li>
<li id="6mcsu"><dl id="6mcsu"></dl></li>
  • <code id="6mcsu"><tr id="6mcsu"></tr></code>
    99re热这里只有精品免费视频| 欧美亚洲综合在线| 日韩一区中文字幕| 色网站国产精品| 日韩精彩视频在线观看| 日韩欧美在线一区二区三区| 国产盗摄视频一区二区三区| 国产精品不卡视频| 欧美日韩国产首页| 久久99国产精品尤物| 国产精品亲子伦对白| 日本道色综合久久| 人人狠狠综合久久亚洲| 国产亚洲一区字幕| 在线观看视频一区二区欧美日韩 | 欧美激情在线免费观看| 91在线无精精品入口| 日欧美一区二区| 久久久亚洲精品石原莉奈| www.亚洲免费av| 日韩不卡一区二区三区| 欧美激情在线一区二区三区| 欧美日韩一区二区电影| 国产一区二区免费看| 亚洲欧美另类图片小说| 91精品国产免费| av影院午夜一区| 日韩 欧美一区二区三区| 欧美国产在线观看| 7777精品伊人久久久大香线蕉经典版下载 | 色婷婷激情久久| 久久av中文字幕片| 亚洲猫色日本管| 欧美成人一级视频| 99精品欧美一区二区三区综合在线| 天堂蜜桃91精品| 国产精品免费网站在线观看| 欧美精品一二三| 成人国产精品免费| 青青草原综合久久大伊人精品 | 国产精品久久久久精k8| 91精品国产色综合久久不卡蜜臀| 北条麻妃国产九九精品视频| 日韩经典一区二区| 亚洲欧美视频一区| 久久久久久久性| 欧美日韩mp4| 99久久精品一区二区| 青青草国产成人av片免费| 亚洲日本电影在线| 久久综合久久久久88| 欧美日韩二区三区| 91视频在线观看免费| 国产主播一区二区| 五月综合激情婷婷六月色窝| 国产精品久久久久久久浪潮网站 | 欧美日韩一区国产| 粉嫩一区二区三区在线看| 蜜臀av在线播放一区二区三区| 亚洲视频一区在线观看| 久久久噜噜噜久噜久久综合| 欧美一区二区视频网站| 日本精品一区二区三区高清 | 日韩综合一区二区| 亚洲乱码中文字幕| 中文字幕精品综合| 久久蜜臀中文字幕| 日韩免费福利电影在线观看| 欧美日韩亚洲综合一区二区三区 | 精品国产污网站| 欧美日韩在线电影| 色天使久久综合网天天| 成人免费毛片aaaaa**| 国产一区二区三区久久久| 日本不卡免费在线视频| 亚洲成人手机在线| 亚洲免费在线播放| 中文成人av在线| 久久久777精品电影网影网| 日韩欧美高清在线| 91麻豆精品国产91久久久更新时间| 色爱区综合激月婷婷| av在线这里只有精品| 国产成人综合网站| 国模无码大尺度一区二区三区| 美女视频黄 久久| 亚洲3atv精品一区二区三区| 一区av在线播放| 一区二区三区四区激情| 亚洲男人的天堂在线观看| 日韩毛片视频在线看| 成人免费在线播放视频| 中文字幕一区二区三区乱码在线| 国产精品久久久久天堂| 国产精品久久免费看| 中文一区一区三区高中清不卡| 久久精品亚洲国产奇米99| 久久久天堂av| 日本一区二区三区高清不卡| 国产午夜久久久久| 中文乱码免费一区二区| 国产精品久久久久桃色tv| 成人免费一区二区三区视频| 亚洲视频你懂的| 亚洲精品久久久蜜桃| 亚洲最大色网站| 亚洲一区二区三区四区中文字幕| 亚洲综合精品自拍| 亚洲777理论| 免费高清不卡av| 国产一区二区三区免费观看| 国产99久久久久久免费看农村| 成人激情小说网站| 色偷偷成人一区二区三区91| 在线观看亚洲专区| 4438x亚洲最大成人网| 日韩一区二区视频在线观看| 精品久久免费看| 中文子幕无线码一区tr| 中文字幕在线免费不卡| 亚洲免费观看高清在线观看| 亚洲一卡二卡三卡四卡无卡久久 | 欧美日韩一区三区四区| 666欧美在线视频| 精品日韩欧美一区二区| 中文幕一区二区三区久久蜜桃| 亚洲日本在线天堂| 午夜精品影院在线观看| 麻豆中文一区二区| 国产精品综合在线视频| 95精品视频在线| 欧美电影在线免费观看| 欧美成人免费网站| 国产精品久久久久一区二区三区| 亚洲一区成人在线| 久久av中文字幕片| 99久久精品一区二区| 欧美久久一二区| 2017欧美狠狠色| 亚洲少妇屁股交4| 丝袜亚洲另类丝袜在线| 激情深爱一区二区| 91丨九色丨蝌蚪丨老版| 欧美理论片在线| 久久精品亚洲一区二区三区浴池| 亚洲免费大片在线观看| 日本vs亚洲vs韩国一区三区二区| 国产91露脸合集magnet | 日韩一区二区精品在线观看| 久久精品综合网| 亚洲午夜激情网站| 久久精品999| 色综合天天综合| 日韩欧美一级二级三级| 国产精品不卡视频| 蜜桃av噜噜一区| 91丨九色porny丨蝌蚪| 日韩欧美国产一区二区三区| 亚洲日本一区二区三区| 麻豆成人av在线| 91久久精品国产91性色tv| 日韩欧美久久一区| 亚洲精品乱码久久久久久日本蜜臀| 美国十次了思思久久精品导航| av亚洲产国偷v产偷v自拍| 欧美精品一二三| 亚洲色图另类专区| 九九视频精品免费| 在线观看亚洲精品视频| 国产日本欧美一区二区| 午夜欧美视频在线观看| 成人黄色777网| 日韩美女天天操| 亚洲国产日日夜夜| 成人黄页在线观看| 欧美电影免费观看高清完整版| 亚洲免费观看高清完整版在线观看熊| 久久99久久久久| 欧美日韩综合一区| 国产精品久久影院| 捆绑紧缚一区二区三区视频| 欧美午夜一区二区三区| 国产精品天天看| 精品一区二区在线看| 欧美男男青年gay1069videost | 中文字幕中文在线不卡住| 奇米在线7777在线精品| 色噜噜狠狠色综合欧洲selulu| 国产人妖乱国产精品人妖| 毛片不卡一区二区| 欧美色精品天天在线观看视频| 中文字幕一区视频| 国产精品一区二区久久不卡| 欧美一区二区在线免费观看| 亚洲一二三四久久| 91丨porny丨在线| 中文久久乱码一区二区| 国产精品中文欧美| 精品久久久久久久久久久久包黑料| 亚洲高清免费观看高清完整版在线观看|