<code id="6mcsu"></code>
<li id="6mcsu"></li>
<li id="6mcsu"><dl id="6mcsu"></dl></li>
  • <code id="6mcsu"><tr id="6mcsu"></tr></code>
    或者

    解析篇——VIP大講堂(上海站)QA集錦

    作者:月光邊境 瀏覽:136 發布時間:2018-05-28
    分享 評論 0

    上周為站長朋友們獻出了VIP大講堂上海站中關于SPIDE抓取建庫方面的QA內容,本周繼續將解析方面的QA內容奉上。

      問:我們的頁面本身就很大,會不會解析不出來?

      答:頁面本身很大倒沒問題,趕集、安居客這些量都很大,沒有問題。我剛才說的例子,你每次都follow出來新鏈接,隨機把后面的參數去掉都不影響這個網頁的正常訪問,這種肯定有問題的。

      問:剛才說對URL的長度有要求,那對每一段、就是目錄名的長度有沒有要求

      答:沒有要求,我們是要求url從www開始到結束,總長度不超過1024個字節。

      問:站內重復內容是怎么判斷的?文本內容一樣結構不一樣,算不算重復?

      答:算重復

      問:假設是整個頁面全是Flash,如果我把一些欄目或者最新的內容隱藏掉,不影響美觀隱藏掉,如果用hidden屬性能不能提取出來?CSS可不可以?

      答:hidden可以提出來,但如果是注釋就不會管。CSS不可以。

      問:頁面大小不超過1兆,是指頁面壓縮以前還是以后。

      答:指頁面壓縮以后,不要超過1兆

      問:我網站的信息已經過時了,但網頁返回的是200,會受懲罰?為什么呀?

      答:用戶在搜索結果里點了你的結果,導流導到你的網站,但沒什么可看的,對用戶沒有用,百度當然不喜歡。

      問:現在我們很多網站,為了讓用戶覺得有意思,內容沒了就放一張圖片,寫一些有意思的話,什么“工程師去哪啦”之類的,對百度友好不?

      答:最好不要用,我知道站點是想讓百度當內容死鏈來識別,但內容死鏈識別起來是有準確率和召回率風險的。

      問:我們團購網站的確會有過期團購的頁面,會受懲罰嗎

      答:如果量特別大、點擊量很大的話肯定會有懲罰的。有些可以當內容死鏈被分析出來,如果分析不出來,會被一些其他的策略挖出來,會有這樣的問題。

      問:剛才說資訊內容頁面,上面有個發布時間好,那如果頁面上沒有時間呢?

      答:那我們往往是按當時抓取的時間來做判定。

      問:評論里面時間重要嗎。

      答:百度更重視主體內容的時間,評論不算主體內容。

      問:我們是個平臺,很多產品其實只是一個型號變更了,其實顏色都是一模一樣的,對蜘蛛而言僅僅只是幾個字符,會被識別為重復嗎

      答:如果是一個產品的結構化信息的話,應該不會被認為是重復。如果你是簡單內容摘要的方式進行介紹的話,可能會存在重復問題。

      問:靜態URL和動態URL區別大嗎?

      答:不大,我們現在認為靜態和動態都一樣的,因為從url上面他能夠識別出來,但是抓取回來的東西不太一樣。所以現在認為無論你是靜態還是動態,我們都認為同樣都是url來對待。


    一区二区三区无码高清视频| 亚洲色中文字幕无码AV| 亚洲精品无码久久久久| 亚洲一级Av无码毛片久久精品| 中文无码字慕在线观看| 亚洲 欧美 国产 日韩 中文字幕| 亚洲综合无码AV一区二区 | 寂寞少妇做spa按摩无码| 亚洲中文字幕无码一去台湾| 国产热の有码热の无码视频| 免费无码又爽又刺激网站| 亚洲日产无码中文字幕| 国产羞羞的视频在线观看 国产一级无码视频在线 | 亚洲熟妇无码乱子AV电影| 中文字幕视频一区| 中文在线资源天堂WWW| 丰满白嫩人妻中出无码| 无码少妇一区二区性色AV| 无码精品A∨在线观看免费| 中文字幕亚洲第一在线| 亚洲中文字幕无码一区| 亚洲 日韩经典 中文字幕| 午夜无码中文字幕在线播放 | 国产网红主播无码精品| 国产成A人亚洲精V品无码性色| 亚洲国产精品无码久久久蜜芽| 中文字幕亚洲图片| 日韩视频中文字幕精品偷拍| 久久亚洲精精品中文字幕| 中文字幕乱码人妻无码久久| 中文字幕无码久久久| 亚洲中文字幕无码久久2017| 亚洲精品无码专区在线播放| 亚洲av无码专区在线观看素人| 亚洲成?Ⅴ人在线观看无码| 中文字幕丰满乱子无码视频| 中文字幕丰满伦子无码| 无码专区久久综合久中文字幕| 人妻中文字系列无码专区| 中文字幕一区二区三区精彩视频| 日韩中文字幕电影|