<code id="6mcsu"></code>
<li id="6mcsu"></li>
<li id="6mcsu"><dl id="6mcsu"></dl></li>
  • <code id="6mcsu"><tr id="6mcsu"></tr></code>
    或者

    頁面長度過長,也會導(dǎo)致不收錄?

    作者:9527 瀏覽:144 發(fā)布時間:2017-07-20
    分享 評論 0

        最近院長收到一個非常典型的抓取優(yōu)化例子,整理一下分享給各位,各位站長們謹記不要出現(xiàn)相同的情況:


        站點反饋:


        網(wǎng)站主體內(nèi)容都是js生成,針對用戶訪問,沒有做優(yōu)化;但是網(wǎng)站特針對爬蟲抓取做了優(yōu)化,直接將圖片二進制內(nèi)容放到了html中導(dǎo)致頁面長度過長;然而優(yōu)化后發(fā)現(xiàn)內(nèi)容卻不被百度收錄


        頁面質(zhì)量很好,還特意針對爬蟲做了優(yōu)化,為什么內(nèi)容反而不收錄了呢?


        工程師分析:


        1、網(wǎng)站針對爬蟲爬取做的優(yōu)化,直接將圖片二進制內(nèi)容放到了html中導(dǎo)致頁面長度過長,網(wǎng)站頁面長度達164k;


        2、 站點優(yōu)化后將主體內(nèi)容放于最后,圖片卻放于前面;


        3、爬蟲抓取內(nèi)容后,頁面內(nèi)容過長被截斷,已抓取部分無法識別到主體內(nèi)容,最終導(dǎo)致頁面被認定為空短而不收錄。


        工程師建議:


        1、不建議站點使用js生成主體內(nèi)容,如js渲染出錯,很可能導(dǎo)致頁面內(nèi)容讀取錯誤,頁面無法抓取


        2、 如站點針對爬蟲爬取做優(yōu)化,建議頁面長度在128k之內(nèi),不要過長


        3、針對爬蟲爬取做優(yōu)化,請將主體內(nèi)容放于前方,避免抓取截斷造成的內(nèi)容抓取不全


    最近中文字幕免费mv在线视频| 日韩免费无码一区二区三区| 亚洲AV无码第一区二区三区| 亚洲中文字幕在线第六区| 亚洲精品无码mv在线观看网站| 亚洲AV中文无码乱人伦在线观看 | 亚洲AV中文无码乱人伦| 亚洲av无码精品网站| 亚洲无av在线中文字幕| av无码播放一级毛片免费野外 | 特级做A爰片毛片免费看无码 | 中文在线√天堂| 亚洲av无码国产精品色在线看不卡 | 日韩丰满少妇无码内射| 三上悠亚ssⅰn939无码播放| 亚洲AV中文无码字幕色三| 西西4444www大胆无码| 久久精品无码一区二区三区| 无码人妻品一区二区三区精99| 日韩免费在线中文字幕| 在线中文字幕播放| 中文字幕乱码无码人妻系列蜜桃| 99国产精品无码| 免费人妻无码不卡中文字幕系| 亚洲Av综合色区无码专区桃色 | 中文成人久久久久影院免费观看| 亚洲精品无码永久中文字幕| 亚洲AV中文无码乱人伦在线视色 | 中文字幕无码久久精品青草| 国产V片在线播放免费无码| 久久久久久亚洲AV无码专区| 少妇无码一区二区三区| 亚洲AV成人无码久久精品老人| 国产成人无码区免费内射一片色欲 | 国产丰满乱子伦无码专区| 无码精品A∨在线观看十八禁| 超碰97国产欧美中文| 最近中文字幕完整免费视频ww| 最近中文字幕在线| 人妻AV中出无码内射| 亚洲桃色AV无码|