<code id="6mcsu"></code>
<li id="6mcsu"></li>
<li id="6mcsu"><dl id="6mcsu"></dl></li>
  • <code id="6mcsu"><tr id="6mcsu"></tr></code>
    或者

    使用robots巧妙避免蜘蛛黑洞

    作者:月光邊境 瀏覽:110 發(fā)布時(shí)間:2017-08-15
    分享 評論 0

    對于百度搜索引擎來說,蜘蛛黑洞特指網(wǎng)站通過極低的成本制造出大量參數(shù)過多、內(nèi)容類同但url不同的動(dòng)態(tài)URL ,就像一個(gè)無限循環(huán)的“黑洞“,將spider困住。spider浪費(fèi)了大量資源抓取的卻是無效網(wǎng)頁。

      如很多網(wǎng)站都有篩選功能,通過篩選功能產(chǎn)生的網(wǎng)頁經(jīng)常會(huì)被搜索引擎大量抓取,而這其中很大一部分是檢索價(jià)值低質(zhì)的頁面。如“500-1000之間價(jià)格的租房”,首先網(wǎng)站(包括現(xiàn)實(shí)中)上基本沒有相關(guān)資源,其次站內(nèi)用戶和搜索引擎用戶都沒有這種檢索習(xí)慣。這種網(wǎng)頁被搜索引擎大量抓取,只能是占用網(wǎng)站寶貴的抓取配額,那么該如何避免這種情況呢?

    1.   我們以北京美團(tuán)網(wǎng)為例,看看美團(tuán)網(wǎng)是如何利用robots巧妙避免這種蜘蛛黑洞的:

    2.   對于普通的篩選結(jié)果頁,使用了靜態(tài)鏈接

    3.   同樣是條件篩選結(jié)果頁,當(dāng)用戶選擇不同排序條件后,會(huì)生成帶有不同參數(shù)的動(dòng)態(tài)鏈接,而且即使是同一種排序條件(如:都是按銷量降序排列),生成的參數(shù)也都是不同的。

      對于美團(tuán)網(wǎng)來說,只讓搜索引擎抓取篩選結(jié)果頁就可以了,而各種帶參數(shù)的結(jié)果排序頁面則通過robots規(guī)則拒絕提供給搜索引擎。在robots.txt的文件用法中有這樣一條規(guī)則:Disallow: /*?* ,即禁止搜索引擎訪問網(wǎng)站中所有的動(dòng)態(tài)頁面。美團(tuán)網(wǎng)恰是通過這種方式,對spider優(yōu)先展示高質(zhì)量頁面、屏蔽了低質(zhì)量頁面,為spider提供了更友好的網(wǎng)站結(jié)構(gòu),避免了黑洞的形成。


    亚洲一区精品无码| 亚洲国产精品无码久久SM| 中文字字幕在线中文无码| 4444亚洲人成无码网在线观看| 中文字幕亚洲图片| 亚洲中文字幕日产乱码高清app| 久久精品无码一区二区无码 | 中文字幕丰满伦子无码| 无码AV中文一区二区三区| 18无码粉嫩小泬无套在线观看| 亚洲熟妇无码AV在线播放| 中文字幕久久精品| 久久亚洲春色中文字幕久久久| 久久精品无码一区二区三区日韩 | 97无码人妻福利免费公开在线视频| 亚洲日韩v无码中文字幕 | 中文字幕人妻色偷偷久久 | 在线欧美中文字幕农村电影| 成人无码免费一区二区三区 | 无码国模国产在线无码精品国产自在久国产 | 久久久久成人精品无码中文字幕 | 亚洲∧v久久久无码精品| 最近中文2019字幕第二页| 最近高清中文字幕免费| 天堂…中文在线最新版在线| 中中文字幕亚洲无线码| 日韩视频无码日韩视频又2021| MM1313亚洲精品无码| 国产精品亚洲αv天堂无码 | 久久受www免费人成_看片中文| 久久久久亚洲av成人无码电影| 国产精品无码v在线观看| 午夜无码国产理论在线| 精品无码久久久久久国产| 青春草无码精品视频在线观| 亚洲色偷拍区另类无码专区| 无码专区一va亚洲v专区在线| 中文字幕无码久久人妻| 亚洲VA中文字幕无码毛片| 日韩国产中文字幕| 久久无码国产专区精品|