<code id="6mcsu"></code>
<li id="6mcsu"></li>
<li id="6mcsu"><dl id="6mcsu"></dl></li>
  • <code id="6mcsu"><tr id="6mcsu"></tr></code>
    或者

    如何利用Robots避免蜘蛛黑洞?

    作者:dengying 瀏覽:1969 發布時間:2015-06-05
    編輯 分享 評論 0

      

        對于百度搜索引擎來說,蜘蛛黑洞特指網站通過極低的成本制造出大量參數過多,及內容雷同但具體參數不同的動態URL ,就像一個無限循環的“黑洞”將spider困住,Baiduspider浪費了大量資源抓取的卻是無效網頁。

      比如很多網站都有篩選功能,通過篩選功能產生的網頁經常會被搜索引擎大量抓取,而這其中很大一部分檢索價值不高,如“500-1000之間價格的租房”,首先網站(包括現實中)上基本沒有相關資源,其次站內用戶和搜索引擎用戶都沒有這種檢索習慣。這種網頁被搜索引擎大量抓取,只能是占用網站寶貴的抓取配額。那么該如何避免這種情況呢?

      我們以北京某團購網站為例,看看該網站是如何利用robots巧妙避免這種蜘蛛黑洞的:

      對于普通的篩選結果頁,該網站選擇使用靜態鏈接,

      如:http://bj.XXXXX.com/category/zizhucan/weigongcun

      同樣是條件篩選結果頁,當用戶選擇不同排序條件后,會生成帶有不同參數的動態鏈接,而且即使是同一種排序條件(如:都是按銷量降序排列),生成的參數也都是不同的。

      如:http://bj.XXXXX.com/category/zizhucan/weigongcun/hot?mtt=1.index%2Fpoi.0.0.i1afqhek

      http://bj.XXXXX.com/category/zizhucan/weigongcun/hot?mtt=1.index%2Fpoi.0.0.i1afqi5c

      對于該團購網來說,只讓搜索引擎抓取篩選結果頁就可以了,而各種帶參數的結果排序頁面則通過robots規則拒絕提供給搜索引擎。

      robots.txt的文件用法中有這樣一條規則:Disallow: /*?* ,即禁止搜索引擎訪問網站中所有的動態頁面。該網站恰是通過這種方式,對Baiduspider優先展示高質量頁面、屏蔽了低質量頁面,為Baiduspider提供了更友好的網站結構,避免了黑洞的形成。


    詞條統計

  • 瀏覽次數:1969
  • 編輯次數:0次歷史版本
  • 最近更新:2015-06-05
  • 創建者:dengying
  • 相關詞條

    相關問答

    相關百科

    相關資訊

    亚洲福利中文字幕在线网址| 日韩专区无码人妻| 影音先锋中文无码一区| 无码人妻一区二区三区在线| 日本中文字幕在线电影| 国产 欧美 亚洲 中文字幕| 97人妻无码一区二区精品免费| 内射人妻少妇无码一本一道| 天堂网www中文在线| 99久久无码一区人妻a黑| 无码无套少妇毛多18PXXXX| 免费看又黄又无码的网站| 最近免费中文字幕大全免费| 久久人妻AV中文字幕| 无码人妻精品一区二区蜜桃AV| 国产精品无码无需播放器| 亚洲日韩中文无码久久| 中文无码熟妇人妻AV在线| 国产资源网中文最新版| 久久精品中文騷妇女内射| 无码丰满熟妇一区二区| 久久伊人中文无码| 成人午夜福利免费专区无码| 国产在线无码不卡影视影院| 无码A级毛片免费视频内谢| 亚洲精品无码Av人在线观看国产| 国产激情无码一区二区三区| 亚洲欧美日韩中文字幕一区二区三区 | 亚洲av无码专区国产乱码在线观看| 亚洲日韩中文在线精品第一 | 亚欧成人中文字幕一区| 日本免费中文字幕| 久久久网中文字幕| 亚洲av中文无码| 蜜桃无码AV一区二区| 中文一国产一无码一日韩| 亚洲精品无码久久久久sm| 亚洲AV无码国产在丝袜线观看| 亚洲Av综合色区无码专区桃色| 日韩精品无码一区二区三区免费| 久久无码人妻一区二区三区|