搜索引擎優化(Search engine optimization,簡稱SEO),指為了提升網頁在搜索引擎自然搜索結果中(非商業性推廣結果)的收錄數量以及排序位置而做的優化行為,這一行為的目的,是為了從搜索引擎中獲得更多的免費流量,以及更好的展現形象。而SEM(Search engine marketing,搜索引擎營銷),則既包括了SEO,也包括了付費的商業推廣優化。
SEO自從1997年左右出現以來,逐漸分化成兩類SEO行為:一類被稱為"白帽SEO",這類SEO起到了改良和規范網站設計的作用,使之對搜索引擎和用戶更加友好,并從中獲取更多合理的流量。搜索引擎鼓勵和支持"白帽SEO"。另一類被稱為"黑帽SEO",這類SEO行為利用和放大搜索引擎的策略缺陷(實際上完美的系統是不存在的)獲取更多用戶訪問量,而這些更多的訪問量,是以傷害用戶體驗為代價的,所以,面對后一種SEO行為,搜索引擎會通 過一些策略進行遏制。
搜索引擎與SEO行為間是一種良性的共生關系,比如很多優質的網站是用Flash或者Ajax做的,搜索引擎就無法很好的爬取和索引。建站者在了解了SEO的一些基本原理后,可以通過對網站的合理優化,使這些優質資源更好的發揮其檢索效果,改善用戶的搜索體驗。同時,對于中國這樣的新興市場,傳統的中小企業對于如何觸網,如何做互聯網營銷,并無多少經驗,在廣大的互聯網創業者中,對于如何SEO也充斥著矛盾的輿論和猜想。
讓更多人了解搜索引擎的工作機制,引導廣泛合理的SEO行為,讓認真做原創優質內容的創業者得到更多流量,令抄襲抓取別人內容的建站行為得到警惕,是百度作為中文搜索領域的領導者應有的責任和義務,只有這樣才能有效支持互聯網創新力量,使互聯網生態圈得到更加健康有序的發展。
第一章:前期準備
┣ 域名注冊
┣ 服務器、空間租用
第二章:面向搜索引擎的網站建設
┣ 良好收錄
┣ 良好排序
┣ 良好展現
第三章:網站運營
┣ 目標=轉化率
┣ 搜索引擎流量分析
┣ 網站信任度
┣ 不斷強化品牌概念
第四章:作弊與懲罰
┣ 百度如何定義作弊
┣ 作弊會受到怎樣的懲罰
┣ 改正后能否解除懲罰?
第五章:關于百度的十萬個為什么
前期準備
域名和服務器空間是網站建設的基礎
域名注冊
域名是用戶對網站的第一印象,能否讓用戶迅速記住域名對網站發展非常重要。建議注冊域名時選擇容易讓用戶記憶、容易產生信任感的域名,這樣可以提高回頭率,并方便用戶推薦。
域名盡量簡短,越短的域名,用戶的記憶成本就越低;
域名可以和網站主題或網站名稱相呼應,讓人看到域名就能聯想到網站內容,比如使用公司名稱、商標、網站名稱或者公司產品等信息來選擇域名;
使用何種形式的域名后綴對百度網頁搜索沒有影響,但域名后綴也需要考慮方便用戶記憶。.com、.cn、.net等常見的域名后綴用戶更容易記憶,一些不常見的后綴可能會讓用戶產生不信任感,增加用戶的判斷成本。
服務器、空間租用
服務器、空間的速度和穩定性直接影響網站的用戶體驗,也會影響搜索引擎的抓取。
建議選擇服務穩定、速度快的服務器或者空間。
選擇有實力的正規空間商
服務器和空間的穩定性需要一定的技術實力來保障,一些沒有實力的空間商,可能無力提供良好的服務,服務的穩定性無法保證。甚至有空間商為了節省資源,故意屏蔽掉Baiduspider的抓取,導致網站無法被百度網頁搜索收錄。
保證用戶的訪問速度和穩定性
根據網站規模和要提供的服務來決定選擇購買何種空間(服務器)
通常空間都會有流量、連接數以及功能上的限制,因為是多個網站共用一臺服務器,穩定性會受到影響,但價格便宜;服務器各種限制較少,可以更自主的管理,但價格較貴。可以根據自己的需求來進行合理的選擇。
根據用戶群分布選擇接入商
由于互通問題的存在,選擇接入商也很重要,如果用戶群主要在聯通,就盡量選擇聯通訪問較好的接入商,如果用戶群主要在電信,則選擇電信訪問較好的接入商。如果用戶群在全國,那就選擇一家互通處理的比較好的接入商。
購買之前,可以先找一兩個空間商現有的客戶網站,測試訪問情況如何。
良好收錄
面向搜索引擎的網站建設
搜索引擎只是網站上一個普通的訪客,對網站的抓取方式、對網站/網頁的價值判斷,也都是從用戶的角度出發的,任何對用戶體驗的改進,都是對搜索引擎改進。對搜索引擎的優化,同時也會讓用戶受益。
面向搜索引擎的網站建設,主要分為三個部分:如何更好的讓搜索引擎收錄網站中的內容、如何在搜索引擎中獲得良好的排名、如何讓用戶從眾多的搜索結果中點擊你的網站。簡單來說,就是收錄、排序、展現。下面我們將從這三個方面分別介紹。
機器可讀
百度通過一個叫做Baiduspider的程序抓取互聯網上的網頁,經過處理后建入索引中。目前Baiduspider只能讀懂文本內容,flash、圖片等非文本內容暫時不能處理,放置在flash、圖片中的文字,百度無法識別。
建議使用文字而不是flash、圖片、Javascript等來顯示重要的內容或鏈接,搜索引擎暫時無法識別Flash、圖片、Javascript中的內容,這部分內容無法搜索到;僅在flash、Javascript中包含鏈接指向的網頁,百度可能無法收錄。
百度建議
使用文字而不是flash、圖片、Javascript等來顯示重要的內容或鏈接;
如果必須使用Flash制作網頁,建議同時制作一個供搜索引擎收錄的文字版,并在首頁使用文本鏈接指向文字版;
Ajax等搜索引擎不能識別的技術,只用在需要用戶交互的地方,不把希望搜索引擎"看"到的導航及正文內容放到Ajax中;
不使用frame和iframe框架結構,通過iframe顯示的內容可能會被百度丟棄。
網站結構
網站應該有清晰的結構和明晰的導航,這能幫助用戶快速從你的網站中找到自己需要的內容,也可以幫助搜索引擎快速理解網站中每一個網頁所處的結構層次。
網站結構建議采用樹型結構,樹型結構通常分為以下三個層次:首頁——頻道——文章頁。象一棵大樹一樣,首先有一個樹干(首頁),然后再是樹枝(頻道),最后是樹葉(普通內容頁)。樹型結構的擴展性更強,網站內容變多時,可以通過細分樹枝(頻道)來輕松應對。
理想的網站結構應該是更扁平一些,從首頁到內容頁的層次盡量少,這樣搜索引擎處理起來,會更簡單。
同時,網站也應該是一個網狀結構,網站上每個網頁都應該有指向上、下級網頁以及相關內容的鏈接:首頁有到頻道頁的鏈接,頻道頁有到首頁和普通內容頁的鏈接、普通內容頁有到上級頻道以及首頁的鏈接、內容相關的網頁間互相有鏈接。
網站中每一個網頁,都應該是網站結構的一部分,都應該能通過其他網頁鏈接到。
總結一下,合理的網站結構應該是一個扁平的樹型網狀結構。
百度建議
確保每個頁面都可以通過至少一個文本鏈接到達;
重要的內容,應該能從首頁或者網站結構中比較淺的層次訪問到;
合理分類網站上的內容,不要過度細分。
網站應該有簡明、清晰的導航,可以讓用戶快速找到自己需要的內容,同時也可以幫助搜索引擎更好的了解網站的結構。
百度建議
為每個頁面都加上導航欄,讓用戶可以方便的返回頻道、網站首頁,也可以讓搜索引擎方便的定位網頁在網結構中的層次;
內容較多的網站,建議使用面包屑式的導航,這更容易讓用戶理解當前所處的位置:網站首頁 > 頻道 > 當前瀏覽頁面 ;
導航中使用文字鏈接,不使用復雜的js或者flash;
使用圖片做導航時,可以使用Alt注釋,用Alt告訴搜索引擎所指向的網頁內容是什么。
合理的返回碼
百度爬蟲在進行抓取和處理時,是根據http協議規范來設置相應的邏輯的,所以請站長們也盡量參考http協議中關于返回碼的含義的定義進行設置。
Baiduspider 對常用的http返回碼的處理邏輯是這樣的:
404 返回碼的含義是 “Not Found”,百度會認為網頁已經失效,那么通常會從搜索結果中刪除,并且短期內 spider 再次發現這條 URL 也不會抓取。
503 返回碼的含義是 “Service Unavailable”,百度會認為該網頁臨時不可訪問,通常網站臨時關閉,帶寬有限等會產生這種情況。對于網頁返回503,百度 spider 不會把這條 URL 直接刪除,短期內會再訪問。屆時如果網頁已恢復,則正常抓取;如果繼續返回503,短期內還會反復訪問幾次。但是如果網頁長期返回503,那么這個 URL 仍會被百度認為是失效鏈接,從搜索結果中刪除。
403 返回碼的含義是 “Forbidden”,百度會認為網頁當前禁止訪問。對于這種情況,如果是新發現的URL,百度 spider 暫不抓取,短期內會再次檢查;如果是百度已經收錄的URL,當前也不會直接刪除,短期內同樣會再訪問。屆時如果網頁允許訪問,則正常抓取;如果仍不允許訪問,短期內還會反復訪問幾次。但是如果網頁長期返回403,百度也會認為是失效鏈接,從搜索結果中刪除。
301 返回碼的含義是 “Moved Permanently”,百度會認為網頁當前跳轉至新URL。當遇到站點遷移、域名更換和站點改版的情況時,推薦使用301返回碼,盡量減少改版帶來的流量損失。雖然百度spider 現在對301跳轉的響應周期較長,但是我們還是推薦大家這么做。
百度建議
如果站點臨時關閉,當網頁不能打開時,不要立即返回404,建議使用503狀態。503可以告知百度spider該頁面臨時不可訪問,請過段時間再重試。
如果百度spider對您的站點抓取壓力過大,請盡量不要使用404,同樣建議返回503。這樣百度spider會過段時間再來嘗試抓取這個鏈接,如果那個時間站點空閑,那它就會被成功抓取了。
有一些網站希望百度只收錄部分內容,例如審核后的內容,累積一段時間的新用戶頁等等。在這種情況,建議新發內容暫時返回403,等審核或做好處理之后,再返回正常狀態的返回碼。
站點遷移,或域名更換時,請使用301返回碼。
子域名與目錄的選擇
選擇使用子域名還是目錄來合理的分配網站內容,對網站在搜索引擎中的表現會有較大的影響。
百度建議
在某個頻道的內容沒有豐富到可以當做一個獨立站點存在之前,使用目錄形式;等頻道下積累了足夠的內容,再轉換成子域名的形式
一個網頁能否排到搜索結果的前面,"出身"很重要,如果出自一個站點權重較高的網站,那排到前面的可能性就越大,反之則越小。通常情況下主站點的權重是最高的,子站點會從主站點繼承一部分權重,繼承的多少,視子站點質量而定。
在內容沒有豐富到可以做為一個獨立站點之前,內容放到主站點下一個目錄中能在搜索引擎中獲得更好的表現。
內容差異度較大、關聯度不高的內容,使用子站點形式
搜索引擎會識別站點的主題,如果站點中內容關聯度不高,可能導致搜索引擎錯誤的識別。關聯度不高的內容,放在不同的子域名下,可以幫助搜索引擎更好的理解站點的主題。
域名間內容做好權限,互相分開,a.example.com下的內容,不能通過b.example.com訪問
子域名間的內容可以互相訪問,可能會被搜索引擎當做重復內容而進行除重處理,保留的url不一定是正常域名下的。
不要濫用子域名
無豐富內容而濫用大量子域名,會被搜索引擎當做作弊行為而受到懲罰。
規范、簡單的url
創建具有良好描述性、規范、簡單的url,有利于用戶更方便的記憶和判斷網頁的內容,也有利于搜索引擎更有效的抓取您的網站。網站設計之初,就應該有合理的url規劃。
百度建議
網站中同一網頁,只對應一個url
如果網站上多種url都能訪問同樣的內容,會有如下危險:
a. 搜索引擎會選一種url為標準,可能會和正版不同
b. 用戶可能為同一網頁的不同url做推薦,多種url形式分散了該網頁的權重
如果你的網站上已經存在多種url形式,建議按以下方式處理:
a. 在系統中只使用正常形式url,不讓用戶接觸到非正常形式的url
b. 不把Session id、統計代碼等不必要的內容放在url中
c. 不同形式的url,301永久跳轉到正常形式
d. 防止用戶輸錯而啟用的備用域名,301永久跳轉到主域名
e. 使用robots.txt禁止Baiduspider抓取您不想向用戶展現的形式
讓用戶能從url判斷出網頁內容以及網站結構信息,并可以預測將要看到的內容
URL盡量短
長長的URL不僅不美觀,用戶還很難從中獲取額外有用的信息。另一方面,短url還有助于減小頁面體積,加快網頁打開速度,提升用戶體驗。
正常的動態url對搜索引擎沒有影響
url是動態還是靜態對搜索引擎沒有影響,但建議盡量減少動態url中包含的變量參數,這樣即有助于減少url長度,也可以減少讓搜索引擎掉入黑洞的風險。
不添加不能被系統自動識別為url組成部分的字符
url中加入了";"、","等字符,用戶在通過論壇、即時通訊工具等渠道推薦這些url時,不能被自動識別為鏈接,增加了用戶訪問這些網頁的困難度。
利用百度提供的URL優化工具檢查
百度站長平臺提供了URL優化工具,可以幫助檢查URL對搜索引擎的友好程度并提出修改建議。
改版/換域名
網站改版、換域名在互聯網飛速發展的情況下是不可避免的,但處理不當,會造成重大的流量損失。
改版、換域名需要考慮的第一要點就是如何保證老用戶不流失,當用戶訪問舊內容時,能引導用戶到新網站上對應的內容,避免出現用戶訪問不到以前收藏的網頁的情況。
我們建議在改版或者換域名時,將舊網頁301永久重定向到內容對應的新網頁,這樣百度更容易發現這個轉變,并迅速的將舊網頁積累的權值傳遞給對應的新網頁。
百度建議
如非必要,不要做整站內容的完全更換
網站改版或者網站內重要頁面鏈接發生變動時,應該將改版前的頁面301永久重定向到改版后的對應的頁面。
網站更換域名,應該將舊域名的所有頁面301永久重定向到新域名上對應的頁面
網站更換域名后,維持舊域名能穩定訪問盡可能長的時間,給用戶多一些時間記憶新域名。
利用站長工具
互聯網越來越龐大、復雜,百度為了更好的處理互聯網上的信息,提供了一些的面向站長的工具,合理的利用這些站長工具,可以起到事半功倍的效果。
Sitemap
百度站長平臺支持通過sitemap提交網站內容。通過sitemap可讓百度收錄的更有效率。
死鏈刪除
百度站長平臺支持通過sitemap向百度提交網站的死鏈列表。網站死鏈過多,不僅影響用戶的訪問體驗,也會影響百度對網站質量的判斷。通過死鏈刪除的接口可以讓百度更快更全面的發現網站死鏈,從而進行有效刪除。
良好排序
面向搜索引擎的網站建設
搜索引擎只是網站上一個普通的訪客,對網站的抓取方式、對網站/網頁的價值判斷,也都是從用戶的角度出發的,任何對用戶體驗的改進,都是對搜索引擎改進。對搜索引擎的優化,同時也會讓用戶受益。
面向搜索引擎的網站建設,主要分為三個部分:如何更好的讓搜索引擎收錄網站中的內容、如何在搜索引擎中獲得良好的排名、如何讓用戶從眾多的搜索結果中點擊你的網站。簡單來說,就是收錄、排序、展現。下面我們將從這三個方面分別介紹。
涵蓋網頁上主要內容的title
網頁的title用于告訴用戶和搜索引擎這個網頁的主要內容是什么,搜索引擎在判斷一個網頁內容權重時,title是主要參考信息之一。
網頁title是網頁上主要內容的概括,搜索引擎可以通過網頁標題迅速的判斷網頁的主題。每個網頁的內容都是不同的,每個網頁都應該有獨一無二的title。
百度建議
通常網頁標題可以這樣描述:
首頁:網站名稱 或者 網站名稱_提供服務介紹or產品介紹
頻道頁:頻道名稱_網站名稱
文章頁:文章title_頻道名稱_網站名稱
推薦做法:
每個網頁應該有一個獨一無二的標題,切忌所有的頁面都使用默認標題;
標題要主題明確,包含這個網頁中最重要的內容;
簡明精練,不羅列與網頁內容不相關的信息;
用戶瀏覽通常是從左到右的,重要的內容應該放到title的靠前的位置;
使用用戶所熟知的語言描述。如果你有中、英文兩種網站名稱,盡量使用用戶熟知的那一種做為標題描述。
良好的內容建設
網站內容建設以服務網站核心價值為主,提供給搜索引擎收錄的也應該是對自己核心價值有幫助的內容。
內容建設要符合網站的主題,比如你的網站是一個it新聞網站,就不要放一堆的美女圖片,除了浪費服務器資源以外,對網站的核心價值不會有任何幫助,看美女圖片的人,不會對it新聞感興趣。
網站的內容應該是面向用戶的,搜索引擎只是網站的一個普通訪客,提供符合用戶需求的原創內容至關重要。
寫好錨文本
錨文本指在做鏈接時所使用的描述文字,用于告訴用戶鏈接所鏈向網頁的主題,錨文本描述越清楚,用戶越容易理解指向網頁的內容。
用戶接觸到你的網頁是從其他網頁的鏈接開始的,這個鏈接的描述能否讓用戶理解對吸引用戶訪問至關重要。如同普通用戶一樣,在搜索引擎剛發現一個新網頁時,錨文本也對這個網頁的描述是唯一的參考因素。
為圖片加alt說明
在網速較慢圖片不能顯示時讓用戶明白圖片要傳達的信息,也能讓搜索引擎了解圖片的內容。
資源較豐富的內容,可以以專題等更豐富的內容組織形式提供給用戶,讓用戶以最低的成本獲取所有需要的信息。
Web2.0類型的網站,應該充分利用自己的優勢,讓用戶通過投票、評論等手段自己去判斷資源的質量,這些對質量的判斷,也可能會被搜索引擎用來判斷資源的價值。
管理好web2.0等用戶產生內容的產品,如果被作弊者利用,可能會影響整個站點的權重。
贏得用戶對網站的推薦
互聯網上提供相同的內容、服務的網站有很多,在內容相同的時候,哪個網站會排在搜索引擎前面呢?決定性的因素就是推薦。我們經常說的超鏈,就是推薦的一種。
當你網站上的內容對用戶有用時,用戶會推薦給別人,推薦的形式可能多種多樣:即時通訊工具上發給自己的朋友、在自己常泡的論壇里轉帖推薦、寫博客很鄭重的介紹、在自己網站上做友情鏈接推薦等等。
這些推薦信息,都會被搜索引擎用來判斷網頁/網站價值的高低。適當的鼓勵、引導用戶推薦你的網站,對網站在搜索引擎中的表現有很大幫助。
良好展現
面向搜索引擎的網站建設
搜索引擎只是網站上一個普通的訪客,對網站的抓取方式、對網站/網頁的價值判斷,也都是從用戶的角度出發的,任何對用戶體驗的改進,都是對搜索引擎改進。對搜索引擎的優化,同時也會讓用戶受益。
面向搜索引擎的網站建設,主要分為三個部分:如何更好的讓搜索引擎收錄網站中的內容、如何在搜索引擎中獲得良好的排名、如何讓用戶從眾多的搜索結果中點擊你的網站。簡單來說,就是收錄、排序、展現。下面我們將從這三個方面分別介紹。
吸引眼球的Title
用戶在百度網頁搜索中搜索到你的網頁時,title會做為最重要的內容顯示在摘要中,一個主題明確的title可以幫助用戶更方便地從搜索結果中判斷你網頁上內容是否符合他需求。
百度建議
標題要主題明確,包含這個網頁中最重要的內容
文章頁title中不要加入過多的額外描述,會分散用戶注意力
使用用戶所熟知的語言描述
如果您的網站用戶比較熟悉,建議將網站名稱列到title中合適的位置,品牌效應會增加用戶點擊的機率
標題要對用戶有吸引力
能讓用戶產生信任感
善用 Meta Description
Meta description是對網頁內容的精練概括。如果description描述與網頁內容相符,百度會把description當做摘要的選擇目標之一,一個好的description會幫助用戶更方便的從搜索結果中判斷你的網頁內容是否和需求相符。
Meta description不是權值計算的參考因素,這個標簽存在與否不影響網頁權值,只會用做搜索結果摘要的一個選擇目標。
* Meta description是meta標簽的一部分,位于html代碼的 < head > 區
百度建議
網站首頁、頻道頁、產品參數頁等沒有大段文字可以用做摘要的網頁最適合使用description;
準確的描述網頁,不要堆砌關鍵詞;
為每個網頁創建不同的description,避免所有網頁都使用同樣的描述;
如果您的網站用戶比較熟悉,建議將網站名稱列到description中合適的位置,品牌效應會增加用戶點擊的機率;
長度合理,不過長不過短。
網站運營
目標 = 轉化率
從搜索引擎獲取流量的最終目的是不斷提高網站的核心價值。從搜索引擎獲得的流量,有多少能轉化為網站的核心價值,這就是轉化率。
內容型網站,忠實用戶是核心價值,把搜索引擎用戶轉變為忠實用戶就是最終目的;SNS網站,注冊用戶是核心價值,讓用戶來你平臺注冊、活動就是最終目的;如果你做電子商務網站,賣東西就是核心價值,把東西賣給顧客就是你要達到的目的。
在統計搜索引擎收益時,建議將轉化率列為最重要的衡量效果指標。
搜索引擎流量分析
搜索引擎用戶在網站上的后續行為決定了這個用戶會不會轉化為忠實用戶,分析用戶行為可以為改進服務提供依據。
以下幾個指標可以更好的分析:
跳出率
只瀏覽一頁便離開的用戶的比例,跳出率高,通常代表網站對用戶沒有吸引力,也可能是網站內容之間的聯系不夠緊密。
退出率
用戶從某個頁面離開次數占總瀏覽量的比例。流程性強的網站,可以進行轉換流程上的退出率分析,用于優化流程。比如購物網站,從商品頁瀏覽-點擊購買-登錄-確認商品-付費這一系列的流程中每一步的退出率都記錄下來,分析退出率異常的步驟,改進設計。
用戶停留時間
用戶停留時間反映了網站粘性及用戶對網站內容質量的判斷。
以上是統計分析的最基本的三個指標。行為分析可以看出用戶的檢索需求有沒有在你網站上得到滿足,更進一步,思考如何更好的滿足他的需求。
網站信任度
網站信用度指用戶給予你網站的信任程度。用戶對網站的信任度是用戶在網站上進行活動的基礎。
頁面美觀、整潔,有自己的風格;
讓可以很容易的了解到網站的背景;
詳細的網站介紹、聯系方式,讓用戶可以方便的聯系;
用戶評論、顧客反饋等信息,讓原有的用戶影響新用戶;
在網站設計中注重強化網站的品牌,讓用戶更了解、進而信任你的網站。
不斷強化品牌概念
互聯網上的品牌建設是以優質內容、服務換來用戶對網站內容的信任,讓用戶從一個從搜索引擎過客變成忠實用戶的過程。
在滿足用戶需求的同時適當的宣傳品牌,不僅對用戶在面對多個搜索結果時選擇點擊哪個有幫助,也會對口碑傳播有很大的作用。
最低層次,讓用戶知道他所獲取的內容來自你的網站
進階,讓用戶下次再想找這個信息時,能想到你的網站
最終,能讓用戶在找同類內容時,能第一時間想到你的網站
作弊與懲罰
百度如何定義作弊
任何利用和放大搜索引擎的策略缺陷,利用惡意手段獲取與網頁質量不符的排名,引起用搜索結果質量和用戶搜索體驗下降的行為都會被搜索引擎當做作弊行為。
具體的作弊手法是無法窮盡的。互聯網在動態的發展,搜索引擎也在動態的發展,作弊行為自然也是在動態的發展。最基本的界定法則,就是這個行為的泛濫,是否會影響搜索系統,最終傷害到用戶的搜索體驗。
下面是一些我們近期發現的作弊形式:
利用正常網站的漏洞,黑掉網站,偷偷放上作弊內容,通過搜索引擎獲取流量,并利用木馬盜取用戶信息;
假冒知名公司官網,用戶在其網站上發生交易完全沒有保障;
利用bsp、bbs等web2.0的內容做群發,內容只是無意義的穿插關鍵詞,引誘用戶下載木馬,損害用戶的安全;
利用bsp、bbs、分類信息等渠道,發布知名公司的客服電話,用戶拔打電話后詐騙用戶錢財。
作弊會受到怎樣的懲罰
任何損害用戶利益和搜索引擎結果質量的行為,都會受到搜索引擎的懲罰。作弊行為在不斷的發展,我們的處理手段也在不斷的變化,但始終都會維持"輕者輕罰,重者重罰"的原則:
對用戶體驗及搜索結果質量影響不大的,去除作弊部分獲得的權值;
對用戶體驗及搜索結果質量影響嚴重的,去除作弊部分獲得的權值并降低網站的權重,直至從搜索結果中徹底清理掉。
改正后能否解除懲罰?
懲罰不是目的,讓互聯網潔凈才是目的。取消作弊行為的網站,百度都持歡迎態度。我們有完善的流程,會定期自動對作弊網站進行檢測,大部分修正了作弊行為的網站,會在一定的觀察期滿后自動解除懲罰。
Q&A 常見問題解答
百度推廣和自然搜索結果的關系是什么?
必須要說明一點的是,"競價排名"這個說法,帶有一些誤導意味。所以,現在百度對這個業務改稱"百度推廣",而不是"競價排名"了。
百度的商業推廣和自然搜索,是由完全獨立的兩個部門分別運營兩套獨立系統,參加商業推廣的網站,在自然結果中一視同仁,沒有任何特殊處理。
百度的商業推廣(包括左側和右側)和自然搜索(從前的特征是后面帶一個鏈接,叫百度快照;但現在大部分的開放搜索結果也是不帶快照鏈接的)是兩個完全獨立的系統。商業推廣的原理,不是"給了錢,自然結果中的某些結果就可以排得更靠前",而是"用戶的關鍵詞被分發到兩個獨立系統中,分別產生了商業結果和自然結果,商業結果在前,自然結果在后,就構成了百度的搜索結果"。
關于這一點的認知,誤會很深,所以做專門的說明。"不給錢就干掉"的傳言,就是在這樣的背景下產生的。
更換空間怎么辦?
參照以下步驟:
開通新的空間,并將網站完整的遷移到新空間,并保持流暢訪問;
將域名的服務器指向更新為新空間的ip;
保證舊空間能持續訪問一段時間;
關注新空間的訪問日志,等Baiduspider的抓取完全遷移到新空間后,停止舊空間的服務。
百度是否支持nofollow?
百度支持< a rel="nofollow" href="url">123</a>、<meta
name="robots" content="nofollow">兩種寫法的nofollow,帶
有nofollow屬性的url,不會傳遞權值。
百度支持不支持https協議?
百度目前只能收錄少部分https網頁,大部分https網頁無法收錄。網站首頁和對所有用戶都公開的內容頁面,建議不要使用https協議,如果非用不可,盡量將首頁和重要頁面做個http可訪問版,方便百度收錄。
Site語法查到的結果數是百度收錄的網頁數量嗎?
site語法得到的搜索結果數,只是一個估算的數值,僅供參考。
site語法設定的初衷,其實是期望用戶可以設定約束搜索范圍,實現更加精準的搜索。這同intitle,inurl,本質上是相同的。而在這些高級語法下的結果數,和常規搜索一樣,都是"估值",而非精確值。因此,很有可能site下的"結果數"減少了,實際被索引數卻可能增加了。
修改網站標題是否會對網站排名帶來消極影響?
title是極重要的內容。大幅修改,可能會帶來大幅波動。所以請慎重對待網頁標題。建議按照我們上面所推薦的寫法,實事求是的將頁面主旨反映在標題中即可,如無必要,盡量不做大幅修改。
修改首頁的meta description是否會受到懲罰?
meta description只是摘要的一個選擇目標,修改meta description只會影響摘要。我們鼓勵大家通過meta description來撰寫網站的簡介。只是過于頻繁的修改,未必會及時的反饋在摘要中。
百度建議URL靜態化嗎?
URL是動態還是靜態,對百度沒有影響,我們沒有任何歧視動態url的策略。以前之所以說搜索引擎處理不好動態url,主要是因為動態url中參數過多,很容易制造出大量內容相同、url不同的無限循環的"黑洞",spider陷入其中,浪費大量的資源。現在我們已經能比較完美的解決這個問題。
動態url最好象我們建議的那樣,盡量減少動態url中包含的變量參數,一方面可以減短url長度,另一方面,也減少把Baiduspider帶入"黑洞"的風險。
百度支持哪些Robots Meta標簽?
百度支持nofollow、noarchive兩種種meta標簽。
要防止所有搜索引擎顯示您網站的快照,請將此元標記置入網頁的<HEAD> 部分:
<meta name="robots" content="noarchive">
如果您不想搜索引擎追蹤此網頁上的鏈接,且不傳遞鏈接的權重,請將此元標記置入:
<meta name="robots" content="nofollow">
站點啟用CDN、反向代理、開啟gzip壓縮等服務會不會影響搜索引擎收錄?
Baiduspider對站點的抓取方式和普通用戶訪問一樣,只要普通用戶能訪問到的內容,我們就能抓取到。不管是用什么技術,只要能保證用戶能流暢的訪問網站,對搜索引擎就沒有影響。
我們建議盡量選擇有實力的服務商和成熟的技術,不成熟的技術容易導致訪問不穩定,這就有可能影響搜索引擎的抓取了。
百度對使用海外空間的中文網站有歧視嗎?
百度對海外站點沒有歧視。但Baiduspider服務器在國內,國內普通用戶訪問受限的內容,Baiduspider一樣會搞不定,只要國內能正常訪問,我們就會一視同仁。
百度如何對待一個主題完全更換、改版的網站?
如果是內容發生根本性變化,則理論上會被視為一個全新網站,舊有超鏈失效。
搜索結果中帶logo展示的網站結果,展示機制是怎么樣的?
搜索引擎策略會對已收錄的站點站點綜合表現進行自動評價,對符合一定標準的站點,會自動提取網站中的favicon作為展現logo。同時,這個機制是自動運行,定期更新的,沒有人工干預的接口。
第三方站長工具中提供“百度權重”是百度官方數據嗎?
百度從未提供過網站權重信息數據以及對外查詢服務。第三方站長工具的數據并非百度官方數據,不代表真實的網站情況,百度對使用此類數據而造成的困擾不負任何責任。請網站管理員不要將這些“百度權重”數值當成真實數值來參考使用。
如何判斷Baiduspider的真假?
中文互聯網上,Baiduspider ip的hostname以 *.baidu.com的格式命名,非 *.baidu.com即為冒充,建議您使用DNS反查方式來確定抓取來源的ip是否屬于百度。
例如,在linux平臺下,您可以使用host ip命令反解ip來判斷是否來自Baiduspider的抓取。
$ host 123.125.66.120
120.66.125.123.in-addr.arpa domain name pointer
baiduspider-123-125-66-120.crawl.baidu.com.
在windows平臺下,可以用nslookup命令反解ip來判斷是否來自Baiduspider的抓取。
點擊“開始”-“運行”-“cmd”-“輸入nslookup IP地址”-“回車”
C:\Documents and Settings\wangtao>nslookup 123.125.66.120
Name: baiduspider-123-125-66-120.crawl.baidu.com
Address: 123.125.66.120
評論(0人參與,0條評論)
發布評論
最新評論