<code id="6mcsu"></code>
<li id="6mcsu"></li>
<li id="6mcsu"><dl id="6mcsu"></dl></li>
  • <code id="6mcsu"><tr id="6mcsu"></tr></code>
    或者

    人工錄入的種子網站.

    作者:小雞燉蘑菇 瀏覽:813 發布時間:2018-01-09
    分享 評論 0

      廣度優先搜索


      在深度優先搜索算法中,是深度越大的結點越先得到擴展.如果在搜索中把算法改為按結點的層次進行搜索, 本層的結點沒有搜索處理完時,不能對下層結點進行處理,即深度越小的結點越先得到擴展,也就是說先產生 的結點先得以擴展處理,這種搜索算法稱為廣度優先搜索法.


      在深度優先搜索算法中,是深度越大的結點越先得到擴展.如果在搜索中把算法改為按結點的層次進行搜索, 本層的結點沒有搜索處理完時,不能對下層結點進行處理,即深度越小的結點越先得到擴展,也就是說先產生 的結點先得以擴展處理,這種搜索算法稱為廣度優先搜索法.


      吸引蜘蛛


      哪些頁面被認為比較重要呢?有幾方面影響因素:


      · 網站和頁面權重.質量高、資格老的網站被認為權重比較高,這種網站上的頁面被爬行的深度也會比較高,所以會有更多內頁被收錄.


      · 頁面更新度.蜘蛛每次爬行都會把頁面數據存儲起來.如果第二次爬行發現頁面與第一次收錄的完全一樣,說明頁面沒有更新,蜘蛛也就沒有必要經常抓取.如果頁面內容經常更新,蜘蛛就會更加頻繁地訪問這種頁面,頁面上出現的新鏈接,也自然會被蜘蛛更快跟蹤,抓取新頁面.


      · 導入鏈接.無論是外部鏈接還是同一個網站的內部鏈接,要被蜘蛛抓取就必須有導入鏈接進入頁面,否則蜘蛛根本沒有機會知道頁面的存在.高質量的導入鏈接也經常使頁面上的導出鏈接被爬行深度增加.一般來說網站上權重最高的是首頁,大部分外部鏈接是指向首頁,蜘蛛訪問最頻繁的也是首頁.離首頁點擊距離越近,頁面權重越高,被蜘蛛爬行的機會也越大.


      地址庫


      為了避免重復爬行和抓取網址,搜索引擎會建立一個地址庫,記錄已經被發現還沒有抓取的頁面,以及已經被抓取的頁面.地址庫中的uRL有幾個來源:


      (1)人工錄入的種子網站.


      (2)蜘蛛抓取頁面后,從HTML中解析出新的鏈接uRL,與地址庫中的數據進行對比,如果是地址庫中沒有的網址,就存入待訪問地址庫.


      (3)站長通過搜索引擎網頁提交表格提交進來的網址.


      蜘蛛按重要性從待訪問地址庫中提取uRL,訪問并抓取頁面,然后把這個uRL從待訪問地址庫中刪除,放進已訪問地址庫中.


      大部分主流搜索引擎都提供一個表格,讓站長提交網址.不過這些提交來的網址都只是存入地址庫而已,是否收錄還要看頁面重要性如何.搜索引擎所收錄的絕大部分頁面是蜘蛛自己跟蹤鏈接得到的.可以說提交頁面基本t是毫無用處的,搜索引擎更喜歡自己沿著鏈接發現新頁面.


      文件存儲搜索引擎蜘蛛抓取的數據存入原始頁面數據庫.其中的頁面數據與用戶瀏覽器得到的HTML是完全一樣的.每個uRI,都有一個獨特的文件編號.


    中文字幕一二区| 亚洲V无码一区二区三区四区观看 亚洲爆乳精品无码一区二区三区 亚洲爆乳无码一区二区三区 | 欧美日韩中文国产va另类| 岛国av无码免费无禁网| 亚洲欧洲无码AV电影在线观看| 日韩精品无码中文字幕一区二区| 国产AV无码专区亚洲AVJULIA| 日韩精品无码视频一区二区蜜桃 | 最好看的2018中文在线观看| 亚洲AV无码成人精品区在线观看| 精品亚洲欧美中文字幕在线看| 婷婷五月六月激情综合色中文字幕| 精品视频无码一区二区三区| 亚洲AV永久纯肉无码精品动漫| 久久亚洲2019中文字幕| 波多野结衣中文字幕免费视频| 亚洲精品97久久中文字幕无码| (愛妃視頻)国产无码中文字幕| 手机永久无码国产AV毛片| 亚洲av成人无码久久精品| 国产成人精品一区二区三区无码| 最近中文字幕国语免费完整| √天堂中文官网在线| 无码人妻精品中文字幕免费| 中文字幕日韩精品无码内射| 在线综合亚洲中文精品| 漂亮人妻被中出中文字幕久久| 亚洲精品无码AV中文字幕电影网站| 久久伊人亚洲AV无码网站| 国模吧无码一区二区三区| 最近中文字幕免费2019| 亚洲AV无码一区二三区| 中文字幕在线亚洲精品| 亚洲精品无码成人片在线观看| 亚洲AV无码之日韩精品| 亚洲精品无码你懂的网站| 亚洲最大激情中文字幕| 久久精品天天中文字幕人妻 | 亚洲日韩v无码中文字幕| 亚洲爆乳精品无码一区二区| 亚洲AV无码一区二区三区DV|