<code id="6mcsu"></code>
<li id="6mcsu"></li>
<li id="6mcsu"><dl id="6mcsu"></dl></li>
  • <code id="6mcsu"><tr id="6mcsu"></tr></code>
    或者

    搜索引擎檢索系統(tǒng)概述

    作者:月光邊境 瀏覽:172 發(fā)布時(shí)間:2017-05-05
    分享 評論 0

    前面簡要介紹過了搜索引擎的索引系統(tǒng),實(shí)際上在建立倒排索引的最后還需要有一個(gè)入庫寫庫的過程,而為了提高效率這個(gè)過程還需要將全部term以及偏移量保存在文件頭部,并且對數(shù)據(jù)進(jìn)行壓縮,這涉及到的過于技術(shù)化在此就不多提了。今天簡要給大家介紹一下索引之后的檢索系統(tǒng)。

      檢索系統(tǒng)主要包含了五個(gè)部分,如下圖所示:

      

      (1)Query串切詞分詞即將用戶的查詢詞進(jìn)行分詞,對之后的查詢做準(zhǔn)備,以“10號線地鐵故障”為例,可能的分詞如下(同義詞問題暫時(shí)略過):

      10 0x123abc

      號 0x13445d

      線 0x234d

      地鐵 0x145cf

      故障 0x354df

      (2)查出含每個(gè)term的文檔集合,即找出待選集合,如下:

      0x123abc 1 2 3 4 7 9…..

      0x13445d 2 5 8 9 10 11……

      ……

      ……

      (3)求交,上述求交,文檔2和文檔9可能是我們需要找的,整個(gè)求交過程實(shí)際上關(guān)系著整個(gè)系統(tǒng)的性能,這里面包含了使用緩存等等手段進(jìn)行性能優(yōu)化;

      (4)各種過濾,舉例可能包含過濾掉死鏈、重復(fù)數(shù)據(jù)、色情、垃圾結(jié)果以及你懂的;

      (5)最終排序,將最能滿足用戶需求的結(jié)果排序在最前,可能包括的有用信息如:網(wǎng)站的整體評價(jià)、網(wǎng)頁質(zhì)量、內(nèi)容質(zhì)量、資源質(zhì)量、匹配程度、分散度、時(shí)效性等等,之后會詳細(xì)給大家介紹。


    无码无套少妇毛多18p| 永久免费无码网站在线观看个| 国产av无码专区亚洲国产精品 | 精品深夜AV无码一区二区| 久久超乳爆乳中文字幕| heyzo专区无码综合| 中文字幕乱码人妻无码久久| 亚洲中文久久精品无码| 九九久久精品无码专区| 亚洲AV日韩AV高潮无码专区| 亚洲欧美中文日韩V在线观看| 亚洲AV中文无码乱人伦下载 | 中文字幕av高清有码| 无码少妇一区二区浪潮av| 亚洲AV无码一区东京热| 亚洲欧美成人久久综合中文网 | 日本精品久久久久中文字幕| 久久精品无码专区免费| 国产精品无码A∨精品影院| 亚洲精品无码mv在线观看网站 | 中文无码伦av中文字幕| 亚洲一区日韩高清中文字幕亚洲 | 日本在线中文字幕第一视频 | 少妇中文无码高清| 日本免费中文字幕| 亚洲中文字幕在线乱码| 亚洲Av无码乱码在线znlu| 国产成人亚洲综合无码| 88国产精品无码一区二区三区| 无码专区久久综合久中文字幕| 亚洲综合无码AV一区二区 | 无码国产精品一区二区免费vr| 久久亚洲精品无码VA大香大香| 欧美日韩中文字幕在线观看| 欧美日韩中文国产va另类| 中文字幕亚洲综合久久菠萝蜜| 国产成人无码AV麻豆| 国产品无码一区二区三区在线| 亚洲中文字幕无码久久精品1| 暴力强奷在线播放无码| 未满小14洗澡无码视频网站|