<code id="6mcsu"></code>
<li id="6mcsu"></li>
<li id="6mcsu"><dl id="6mcsu"></dl></li>
  • <code id="6mcsu"><tr id="6mcsu"></tr></code>
    或者

    搜索引擎檢索系統概述

    作者:月光邊境 瀏覽:172 發布時間:2017-05-05
    分享 評論 0

    前面簡要介紹過了搜索引擎的索引系統,實際上在建立倒排索引的最后還需要有一個入庫寫庫的過程,而為了提高效率這個過程還需要將全部term以及偏移量保存在文件頭部,并且對數據進行壓縮,這涉及到的過于技術化在此就不多提了。今天簡要給大家介紹一下索引之后的檢索系統。

      檢索系統主要包含了五個部分,如下圖所示:

      

      (1)Query串切詞分詞即將用戶的查詢詞進行分詞,對之后的查詢做準備,以“10號線地鐵故障”為例,可能的分詞如下(同義詞問題暫時略過):

      10 0x123abc

      號 0x13445d

      線 0x234d

      地鐵 0x145cf

      故障 0x354df

      (2)查出含每個term的文檔集合,即找出待選集合,如下:

      0x123abc 1 2 3 4 7 9…..

      0x13445d 2 5 8 9 10 11……

      ……

      ……

      (3)求交,上述求交,文檔2和文檔9可能是我們需要找的,整個求交過程實際上關系著整個系統的性能,這里面包含了使用緩存等等手段進行性能優化;

      (4)各種過濾,舉例可能包含過濾掉死鏈、重復數據、色情、垃圾結果以及你懂的;

      (5)最終排序,將最能滿足用戶需求的結果排序在最前,可能包括的有用信息如:網站的整體評價、網頁質量、內容質量、資源質量、匹配程度、分散度、時效性等等,之后會詳細給大家介紹。


    AV无码久久久久不卡蜜桃| 亚洲中文字幕伊人久久无码| 中文字幕夜色资源网站| 国产日韩精品中文字无码| 超碰97国产欧美中文| 亚洲精品无码av天堂| 久久久无码精品亚洲日韩按摩| 无码人妻少妇久久中文字幕| 亚洲AV无码成人精品区大在线| 无码人妻一区二区三区免费n鬼沢| 中文字幕亚洲色图| 亚洲日韩中文字幕在线播放| 亚洲综合无码一区二区| 曰韩人妻无码一区二区三区综合部| 欧美在线中文字幕| 亚洲中文字幕无码日韩| 精品无码人妻久久久久久| 无码AV中文字幕久久专区| 亚洲Av无码专区国产乱码DVD| 欧美成人中文字幕在线看| 中文无码久久精品| 日本妇人成熟免费中文字幕 | 久久精品无码一区二区app| 亚洲av无码成人黄网站在线观看| 亚洲国产日韩欧美在线a乱码日本中文字幕高清| 亚洲中文字幕无码爆乳av中文| 国产强伦姧在线观看无码| 久久亚洲精品无码AV红樱桃| 亚洲AV无码乱码国产麻豆穿越 | 欧美日韩中文国产va另类| 最近高清中文在线国语字幕5| 波多野结衣中文在线播放| 日韩在线中文字幕| 久久亚洲精品中文字幕三区| 久久久久久久人妻无码中文字幕爆| 无码精品A∨在线观看| 亚洲情XO亚洲色XO无码| 亚洲国产精品无码久久久不卡 | 久久精品无码午夜福利理论片| 乱色精品无码一区二区国产盗| 国精品无码一区二区三区在线|