<code id="6mcsu"></code>
<li id="6mcsu"></li>
<li id="6mcsu"><dl id="6mcsu"></dl></li>
  • <code id="6mcsu"><tr id="6mcsu"></tr></code>
    或者

    大量重復(fù)URL被百度索引收錄的解決方法

    作者:數(shù)風(fēng)流人物 瀏覽:148 發(fā)布時(shí)間:2017-05-03
    分享 評論 0

    最近,很多SEO有這樣的疑惑:索引量工具顯示索引量數(shù)值很高,但流量總也上不去,也沒有發(fā)現(xiàn)我們站內(nèi)有低質(zhì)內(nèi)容,百度這是要鬧哪樣呀?對此,馬海祥找到了導(dǎo)致索引量高流量低的一個(gè)原因,并給出的解決方法。

    首先聲明,我們只談?wù)撚袡z索意義的URL,也就是用戶會從搜索引擎查找的頁面,其他頁面按照常用的方法做屏蔽就好了,鑒于很多站長都愛討論整體的收錄量,我必須潑一下冷水,也許你的有效收錄是1/10。

    1、URL參數(shù)

    URL參數(shù)也叫URL query,是一個(gè)最復(fù)雜,最容易被忽視,最容易被妥協(xié)的問題,他是網(wǎng)站運(yùn)營中必不可少的元素,如果簡單的去除,其他部門就無法工作了,靜態(tài)化是的話題,URL參數(shù)經(jīng)常被用于以下幾方面:

    同一個(gè)實(shí)體的不同狀態(tài)展示,比如同一個(gè)酒店,在不同時(shí)間點(diǎn)會有不同的房間庫存,例如:首頁網(wǎng)址/hotel/123/?checkindate=2015-06-09&checkoutdate=2015-06-10

    為了統(tǒng)計(jì)不同渠道的流量,例如:首頁網(wǎng)址/?tracking=website_a

    為了統(tǒng)計(jì)不同渠道,具體模塊的點(diǎn)擊量,例如:首頁網(wǎng)址/?tracking=website_a&click_spot=zone_abc

    調(diào)試,例如:首頁網(wǎng)址/product/item123/?debug=true

    全世界最奇葩的是亞馬遜,居然把統(tǒng)計(jì)參數(shù)放到了路徑中首頁網(wǎng)址/abc/dp/B005TZHJEQ/ref=lp_2130608051_1_1

    出現(xiàn)這種問題的壞處有幾點(diǎn):

    (1)、浪費(fèi)搜索引擎對你網(wǎng)站的各項(xiàng)配額,從而影響其他正常的頁面。

    (2)、丟失很多本應(yīng)拿到的鏈接加分,站外渠道的鏈接往往是最優(yōu)質(zhì)的,同一個(gè)URL的分值可能分散成幾十份。

    (3)、SEO的流量被統(tǒng)計(jì)到別的渠道(因?yàn)閠racking字段寫的是別的渠道,而且被收錄被點(diǎn)擊)。

    (4)、往往形成一種局面,產(chǎn)品用一套URL,SEO用另一套URL,甚至不同渠道用不同的URL,后期開發(fā)和維護(hù)的成本極高。

    為了解決這個(gè)問題,首先要弄清URL的定義,以馬海祥的理解,每一個(gè)URL是一個(gè)靜態(tài)的、獨(dú)立不重復(fù)的、有意義的實(shí)體,一般也有檢索意義(就是有人會搜),比如一個(gè)人、一輛車、一條道路、一個(gè)零件,而不能混入各種“狀態(tài)”,比如這個(gè)人生病的時(shí)候,難道就不是他自己了么?一件商品在促銷的狀態(tài)難道是另一件商品了么?

    理論上canonical標(biāo)簽就可以解決這個(gè)問題了,但是從實(shí)際測試結(jié)果看,百度對這個(gè)標(biāo)簽的支持優(yōu)先級非常低,幾乎可以忽略不計(jì),因此,馬海祥博客建議的解決方案是這樣的:

    (1)、建立好網(wǎng)站的思維導(dǎo)圖和元信息。

    (2)、所有和SEO元信息相關(guān)的參數(shù)都放到路徑中去。

    (3)、所有和SEO元信息不相干的參數(shù)都放到#后邊,因?yàn)?后邊不影響web服務(wù)器返回的內(nèi)容,簡單的說就是用"#"替代"?"。

    (4)、每個(gè)頁面中都利用js獲取#后邊的參數(shù)對,通過二次請求發(fā)回給統(tǒng)計(jì)服務(wù)器。

    (5)、如果#后邊的參數(shù)影響頁面內(nèi)容,比如酒店的入住日期,那么這部分內(nèi)容用ajax加載就行,他是不穩(wěn)定的,不屬于頁面內(nèi)容的一部分。(當(dāng)然還有變通的辦法,暫不贅述)

    (6)、原始的#錨點(diǎn)定義肯定會沖突,定義一個(gè)#后邊的變量,并用js控制屏幕滾動,來保證原始錨點(diǎn)的作用。

    有人可能會想到,根據(jù)ua判斷,如果是搜索引擎爬蟲,就用跳轉(zhuǎn)的方式去掉URL參數(shù),但在馬海祥看來,效率最高的方法必然是從一開始就不展示錯(cuò)誤URL,那么前面的例子優(yōu)化后就變成了:

    同一個(gè)實(shí)體的不同狀態(tài)展示,比如同一個(gè)酒店,在不同時(shí)間點(diǎn)會有不同的房間庫存,例如:首頁網(wǎng)址/hotel/123/#checkindate=2015-06-09&checkoutdate=2015-06-10

    為了統(tǒng)計(jì)不同渠道的流量,例如:首頁網(wǎng)址/#tracking=website_a

    為了統(tǒng)計(jì)不同渠道,具體模塊的點(diǎn)擊量,例如:首頁網(wǎng)址/#tracking=website_a&click_spot=zone_abc

    調(diào)試,例如:首頁網(wǎng)址/product/item123/#debug=true

    其實(shí)很多網(wǎng)站早就使用這種方式了,但是還有很多網(wǎng)站由于開發(fā)效率無法及時(shí)實(shí)現(xiàn),所以,對于一般的小網(wǎng)站,一定要考慮開發(fā)成本,不要輕易冒進(jìn),只要能避免問題的發(fā)生,變通的方法是很多的。

    2、路徑中使用非必要元素

    很多網(wǎng)站仿照亞馬遜的做法,把商品名體現(xiàn)在URL中,然后再通過id來決定頁面展示的內(nèi)容,例如:首頁網(wǎng)址/博集典藏館043?基督山伯爵-亞歷山大?仲馬/dp/B005TZHJEQ/

    這樣雖然可以提高一些相關(guān)性,但是很危險(xiǎn),在長期甚至短期的時(shí)間內(nèi),大量商品的名稱是非常可能有變化的,那么URL也就跟著變化,成本也是非常高的,因?yàn)榧哟罅思夹g(shù)實(shí)現(xiàn)難度,不管從站內(nèi)還是站外,每次增加鏈接都是一個(gè)很麻煩的事情。

    我曾接手一個(gè)網(wǎng)站,URL被全部改成了這樣:首頁網(wǎng)址/Shangrila_International_Hotel-12345678-hotel/,對我早期的工作造成了非常巨大的負(fù)擔(dān)。

    通過日志分析發(fā)現(xiàn)基本所有的百度蜘蛛發(fā)起的請求都被301跳轉(zhuǎn)了一次,細(xì)致調(diào)查后發(fā)現(xiàn),從SEO拼接規(guī)則到后臺的漢字和翻譯數(shù)據(jù)被一直修改,也就是說,這個(gè)URL相關(guān)的元素有:

    (1)、中文(非必要元素)

    (2)、由中文翻譯的英文(非必要元素)

    (3)、id(必要元素)

    而當(dāng)時(shí)負(fù)責(zé)SEO的同事把英文和id拼接在了URL中,那么這樣一個(gè)URL先后變成過:

    首頁網(wǎng)址/Shangrila_International_Hotel-12345678-hotel/

    首頁網(wǎng)址/Xianggelila_International_Hotel-12345678-hotel/

    首頁網(wǎng)址/XiangGeLiLa_International_Hotel-12345678-hotel/

    首頁網(wǎng)址/Shangrila_guoji_Hotel-12345678-hotel/

    跟“相關(guān)性”比,URL的唯一性和穩(wěn)定性更重要,所以,針對這個(gè)問題,URL的最佳策略應(yīng)該是:首頁網(wǎng)址/hotel/12345678/

    如果這個(gè)id是隸屬于一個(gè)分類下的,比如城市,那么就可以是:首頁網(wǎng)址/hotel/beijing/123/

    從技術(shù)角度說,id一般是數(shù)據(jù)庫的primary key,可以是數(shù)字也可以是字符串,那么這個(gè)時(shí)候URL是一維的;id也可以是聯(lián)合的唯一索引,那么URL就是二維的,就像上面的(bejing,123)缺一不可,電商類網(wǎng)站列表頁經(jīng)常用到三維以上。

    3、URL中的字母建議全部小寫

    如果網(wǎng)站的技術(shù)架構(gòu)用的是開源系統(tǒng),一般是不會有這個(gè)問題的,如果使用了微軟的技術(shù)架構(gòu),這個(gè)問題非常常見:

    首頁網(wǎng)址/newyork/

    首頁網(wǎng)址/Newyork/

    首頁網(wǎng)址/NewYork/

    我的建議是統(tǒng)一使用小寫,大寫自動跳轉(zhuǎn)為小寫(小心301死循環(huán))。

    URL中字母全部小寫主要有兩個(gè)好處:

    (1)、全部使用小寫方便用戶輸入,不會因?yàn)榇笮懟齑顚?dǎo)致用戶輸寫錯(cuò)誤。

    (2)、當(dāng)我們寫robots文件代碼時(shí),其也是區(qū)分大小寫的,往往一個(gè)字母之差可能就導(dǎo)致整個(gè)目錄不能被搜索引擎收錄。

    4、目錄的規(guī)范

    很多網(wǎng)站同時(shí)存在這樣的URL,無形中把收錄量擴(kuò)大了一倍:

    首頁網(wǎng)址/product/123

    首頁網(wǎng)址/product/123/

    上邊第一個(gè)路徑的意思是在product目錄下有一個(gè)123文件,第二個(gè)路徑的意思是在product目錄下有一個(gè)123目錄,這個(gè)目錄下可能有很多文件,但是他代表眾多文件中的index.html或index.php或default.aspx等優(yōu)先級最高的那個(gè)文件,為了避免歧義,我定義文件都是用".html"結(jié)尾的。

    為了減少重復(fù)收錄,那么按我的習(xí)慣是:

    首頁網(wǎng)址/product/123  => 首頁網(wǎng)址/product/123/

    首頁網(wǎng)址/product/123  => 首頁網(wǎng)址/product/123.html

    簡單的來說,就是以下幾點(diǎn):

    (1)、所有部門統(tǒng)一使用SEO定義的URL,屏蔽非SEO優(yōu)化URL的入口。

    (2)、用“#”替代“?”。

    (3)、統(tǒng)一使用小寫。

    (4)、保證目錄的規(guī)范,把不規(guī)范的URL跳轉(zhuǎn)到規(guī)范的URL。

    5、URL盡量使用靜態(tài)化處理

    現(xiàn)在的網(wǎng)站絕大多數(shù)是使用數(shù)據(jù)庫進(jìn)行驅(qū)動的,頁面是由程序?qū)崟r(shí)生成,而不是真的在服務(wù)器上有一個(gè)靜態(tài)HTML文件存在,當(dāng)用戶訪問一個(gè)網(wǎng)址時(shí),程序根據(jù)URL中的參數(shù)調(diào)用數(shù)據(jù)庫數(shù)據(jù),實(shí)時(shí)生成頁面內(nèi)容,因此,動態(tài)頁面相對應(yīng)的URL原始狀態(tài)也是動態(tài)的,其中包含了問號、等號及參數(shù),這就造成了搜索引擎收錄困難,所以,如果沒有什么特殊原因的話,盡量對URL做靜態(tài)化處理。

    6、URL層級不要超過三層

    當(dāng)然,這里說的URL層級不超過三層說的是那些中小型網(wǎng)站,如果你的網(wǎng)站是大型網(wǎng)站那就不在這個(gè)控制范圍內(nèi)了,因?yàn)樗阉饕姘岩恍┐笮途W(wǎng)站的頻道頁也當(dāng)成一個(gè)單獨(dú)的種子站點(diǎn)來處理了,搜索引擎就會在這個(gè)頻道頁再深度爬取三層,也就是說,一些大型網(wǎng)站的頻道頁就相當(dāng)于我們一個(gè)個(gè)人網(wǎng)站了。

    7、URL盡量越短越好

    這個(gè)主要是站在用戶的角度考慮了,因?yàn)閁RL越短,代表用戶就越方便記憶,用戶看起來也沒有那么費(fèi)事,相對于搜索引擎來說,只要我們控制好URL長度不超過1000字母,那搜索引擎收錄起來是完全沒有問題的。



    中文字幕在线观看一区二区| 中文无码制服丝袜人妻av| 人妻精品久久久久中文字幕69 | 久久青青草原亚洲av无码| 久久久久久国产精品无码下载| 制服丝袜中文字幕在线| 日韩AV无码不卡网站| 熟妇人妻无码中文字幕| 中文字幕久久精品无码| 日韩视频中文字幕精品偷拍| 亚洲中文字幕在线乱码| 免费a级毛片无码| 精品成在人线AV无码免费看 | 无码AV岛国片在线播放| 99精品人妻无码专区在线视频区| 暖暖免费在线中文日本| 忘忧草在线社区WWW中国中文 | 无码人妻精品中文字幕免费东京热 | 无码人妻精品一区二区蜜桃百度| 无码乱人伦一区二区亚洲| 国产成人综合日韩精品无码不卡| 久久精品中文字幕一区| 久久婷婷综合中文字幕| 99久久无色码中文字幕| 亚洲中文字幕无码久久综合网| 中文字幕AV影片在线手机播放| 亚洲av无码国产精品色在线看不卡 | 中文无码精品一区二区三区| 亚洲欧美日韩国产中文| 中文字幕高清在线| 佐佐木明希一区二区中文字幕| 最近中文字幕mv免费高清视频8| 天堂√最新版中文在线天堂| 超清无码无卡中文字幕| 国内精品久久久人妻中文字幕| 无码中文人妻视频2019| 一区二区三区观看免费中文视频在线播放| 亚洲AV中文无码乱人伦下载| 中文字幕你懂的| 国产激情无码一区二区三区| 亚洲AV永久青草无码精品|