<code id="6mcsu"></code>
<li id="6mcsu"></li>
<li id="6mcsu"><dl id="6mcsu"></dl></li>
  • <code id="6mcsu"><tr id="6mcsu"></tr></code>
    或者

    頁面長度過長,也可能導致不收錄

    作者:為你代言 瀏覽:58 發布時間:2017-07-01
    分享 評論 0

        最近收到一個非常典型的抓取優化例子,整理一下分享給各位,各位站長們謹記不要出現相同的情況:


        站點反饋:


        網站主體內容都是js生成,針對用戶訪問,沒有做優化;但是網站特針對爬蟲抓取做了優化,直接將圖片二進制內容放到了html中導致頁面長度過長;然而優化后發現內容卻不被百度收錄


        頁面質量很好,還特意針對爬蟲做了優化,為什么內容反而不收錄了呢?


        分析:


        1、網站針對爬蟲爬取做的優化,直接將圖片二進制內容放到了html中導致頁面長度過長,網站頁面長度達164k;


        2、 站點優化后將主體內容放于最后,圖片卻放于前面;


        3、爬蟲抓取內容后,頁面內容過長被截斷,已抓取部分無法識別到主體內容,最終導致頁面被認定為空短而不收錄.


        建議:


        1、不建議站點使用js生成主體內容,如js渲染出錯,很可能導致頁面內容讀取錯誤,頁面無法抓取


        2、 如站點針對爬蟲爬取做優化,建議頁面長度在128k之內,不要過長


        3、針對爬蟲爬取做優化,請將主體內容放于前方,避免抓取截斷造成的內容抓取不全


    免费无码作爱视频| 人妻无码人妻有码中文字幕| 色欲综合久久中文字幕网| 亚洲V无码一区二区三区四区观看| 激情欧美一区二区三区中文字幕| 国产精品无码无卡无需播放器| 人妻无码精品久久亚瑟影视| 久久最近最新中文字幕大全| 无码专区国产无套粉嫩白浆内射| 日韩av无码中文字幕| 亚洲国产综合无码一区| 午夜无码中文字幕在线播放| 亚洲va中文字幕无码| 精品人妻系列无码天堂| 亚洲AV永久无码区成人网站| 中文无码熟妇人妻AV在线| 波多野结衣在线aⅴ中文字幕不卡| 五十路熟妇高熟无码视频| 精品无码久久久久久国产| 无码国产精品一区二区免费3p| 精品欧洲av无码一区二区14| 亚洲伊人久久综合中文成人网| www.中文字幕| 在线中文字幕播放| 人妻丝袜中文无码av影音先锋专区 | а天堂中文在线官网| 中文在线资源天堂WWW| 亚洲午夜AV无码专区在线播放| AV成人午夜无码一区二区| 成 人无码在线视频高清不卡| 玖玖资源站无码专区| 久久国产亚洲精品无码| 精品深夜AV无码一区二区| 国产精品多人p群无码| 国产精品无码无卡在线播放| 久久精品亚洲中文字幕无码麻豆| 日日麻批免费40分钟无码| 色噜噜综合亚洲av中文无码 | 永久免费av无码网站yy| 精品无码免费专区毛片| 亚洲AV无码不卡无码|