久草中文在线观看_久久精品中文字幕一区_亚洲日本欧美日韩中文字幕_熟妇人妻无乱码中文字幕真矢织江

或者

全面的SEO優化技術教程

作者:數風流人物 瀏覽:7426 發布時間:2017-06-28
分享 評論 0

用思維超越競爭對手的SEO技術,很多人一直沉迷研究百度SEO算法,卻不知道搜索引擎一直未變,接下來南安SEO分享搜索引擎的優化技術。

搜索引擎習性眾所周知的是:

搜索引擎認為最有價值的:內容——社會化——用戶體驗——鏈接建設——SEO

5大SEO最應該花精力的地方:可爬行性——網站結構——內容層級結構——頁面元素、內容創作——鏈接建設

應該優化什么:

質量——內容、鏈接、外觀;信任——權威度、有用、資源;受歡迎程度——流量、回訪、訪問、鏈接;及時性——當前、最新、相關

搜索引擎的工作原理非常復雜,而簡單的講搜索引擎的工過程大體可以分成三個階段。

爬行和抓?。核阉饕嬷┲胪ㄟ^跟蹤鏈接訪問頁面,獲取頁面HTML代碼存入數據庫。

預處理:搜索引擎對抓取來的頁面數據文字進行文字提取、中文分詞、索引等處理,以備排名程序調用。

排名:用戶輸入關鍵字后,排名調用索引庫數據,計算相關性,然后按一定格式生成搜索結果頁面。

爬行和抓取

爬行和抓取是搜索引擎工作的第一步,完成數據收集任務。

蜘蛛

搜索引擎用來爬行和訪問頁面的程序被稱為蜘蛛(spider),也稱為機器人(bot)。

跟蹤鏈接

為了抓取網上盡量多的頁面,搜索引擎蜘蛛會跟蹤頁面上的鏈接,從一個頁面爬到下一個頁面,就好像蜘蛛在蜘蛛網上爬行那樣,這也就是搜索引擎蜘蛛這個名稱的由來。最簡單的爬行遍歷策略分為兩種,一是深度優先,二是廣度優先。

深度優化搜索

深度優先搜索就是在搜索樹的每一層始終先只擴展一個子節點,不斷地向縱深前進直到不能再前進(到達葉子節點或受到深度限制)時,才從當前節點返回到上一級節點,沿另一方向又繼續前進。這種方法的搜索樹是從樹根開始一枝一枝逐漸形成的。

深度優先搜索亦稱為縱向搜索。由于一個有解的問題樹可能含有無窮分枝,深度優先搜索如果誤入無窮分枝(即深度無限),則不可能找到目標節點。所以,深度優先搜索策略是不完備的。另外,應用此策略得到的解不一定是最佳解(最短路徑)。

廣度優先搜索

在深度優先搜索算法中,是深度越大的結點越先得到擴展。如果在搜索中把算法改為按結點的層次進行搜索,本層的結點沒有搜索處理完時,不能對下層結點進行處理,即深度越小的結點越先得到擴展,也就是說先產生 的結點先得以擴展處理,這種搜索算法稱為廣度優先搜索法。

在深度優先搜索算法中,是深度越大的結點越先得到擴展。如果在搜索中把算法改為按結點的層次進行搜索,本層的結點沒有搜索處理完時,不能對下層結點進行處理,即深度越小的結點越先得到擴展,也就是說先產生的結點先得以擴展處理,這種搜索算法稱為廣度優先搜索法。

吸引蜘蛛

哪些頁面被認為比較重要呢?有幾方面影響因素:

? 網站和頁面權重。質量高、資格老的網站被認為權重比較高,這種網站上的頁面被爬行的深度也會比較高,所以會有更多內頁被收錄。

? 頁面更新度。蜘蛛每次爬行都會把頁面數據存儲起來。如果第二次爬行發現頁面與第一次收錄的完全一樣,說明頁面沒有更新,蜘蛛也就沒有必要經常抓取。如果頁面內容經常更新,蜘蛛就會更加頻繁地訪問這種頁面,頁面上出現的新鏈接,也自然會被蜘蛛更快跟蹤,抓取新頁面。

? 導入鏈接。無論是外部鏈接還是同一個網站的內部鏈接,要被蜘蛛抓取就必須有導入鏈接進入頁面,否則蜘蛛根本沒有機會知道頁面的存在。高質量的導入鏈接也經常使頁面上的導出鏈接被爬行深度增加。一般來說網站上權重最高的是首頁,大部分外部鏈接是指向首頁,蜘蛛訪問最頻繁的也是首頁。離首頁點擊距離越近,頁面權重越高,被蜘蛛爬行的機會也越大。

地址庫

為了避免重復爬行和抓取網址,搜索引擎會建立一個地址庫,記錄已經被發現還沒有抓取的頁面,以及已經被抓取的頁面。地址庫中的uRL有幾個來源:

(1)人工錄入的種子網站。

(2)蜘蛛抓取頁面后,從HTML中解析出新的鏈接uRL,與地址庫中的數據進行對比,如果是地址庫中沒有的網址,就存入待訪問地址庫。

(3)站長通過搜索引擎網頁提交表格提交進來的網址。

蜘蛛按重要性從待訪問地址庫中提取uRL,訪問并抓取頁面,然后把這個uRL從待訪問地址庫中刪除,放進已訪問地址庫中。

大部分主流SEO(seo.cao4.net)搜索引擎都提供一個表格,讓站長提交網址。不過這些提交來的網址都只是存入地址庫而已,是否收錄還要看頁面重要性如何。搜索引擎所收錄的絕大部分頁面是蜘蛛自己跟蹤鏈接得到的??梢哉f提交頁面基本上是毫無用處的,搜索引擎更喜歡自己沿著鏈接發現新頁面。

文件存儲搜索引擎蜘蛛抓取的數據存入原始頁面數據庫。其中的頁面數據與用戶瀏覽器得到的HTML是完全一樣的。每個uRI,都有一個獨特的文件編號。

爬行時的復制內容檢測

檢測并刪除復制內容通常是在下面介紹的預處理過程中進行的,但現在的蜘蛛在爬行和抓取文件時也會進行定程度的復制內容檢測。遇到權重很低的網站上大量轉載或抄襲內容時,很可能不再繼續爬行。這也就是有的站長在日志文件中發現了蜘蛛,但頁面從來沒有被真正收錄過的原因。

預處理

在一些SEO材料中,“預處理”也被簡稱為“索引”,因為索引是預處理最主要的步驟。

搜索引擎蜘蛛抓取的原始頁面,并不能直接用于查詢排名處理。搜索引擎數據庫中的頁面數都在數萬億級別以上,用戶輸入搜索詞后,靠排名程序實時對這么多頁面分析相關性,計算量太大,不可能在一兩秒內返回排名結果。因此抓取來的頁面必須經過預處理,為最后的查詢排名做好準備。

和爬行抓取一樣,預處理也是在后臺提前完成的,用戶搜索時感覺不到這個過程。

1.提取文字

現在的搜索引擎還是以文字內容為基礎。蜘蛛抓取到的頁面中的HTML代碼,除了用戶在瀏覽器上可以看到的可見文字外,還包含了大量的HTML格式標簽、 JavaScript程序等無法用于排名的內容。搜索引擎預處理首先要做的就是從HTML文件中去除標簽、程序,提取出可以用于排名處理的網頁面文字內容。

除去HTML代碼后,剩下的用于排名的文字只是這一行:

除了可見文字,搜索引擎也會提取出一些特殊的包含文字信息的代碼,如Meta標簽中的文字、圖片替代文字、Flash文件的替代文字、鏈接錨文字等。

2.中文分詞

分詞是中文搜索引擎特有的步驟。搜索引擎存儲和處理頁面及用戶搜索都是以詞為基礎的。英文等語言單詞與單詞之間有空格分隔,搜索引擎索引程序可以直接把句子劃分為單詞的集合。而中文詞與詞之間沒有任何分隔符,一個句子中的所有字和詞都是連在一起的。搜索引擎必須首先分辨哪幾個字組成一個詞,哪些字本身就是一個詞。比如“減肥方法”將被分詞為“減肥”和“方法”兩個詞。

中文分詞方法基本上有兩種,一種是基于詞典匹配,另一種是基于統計。

基于詞典匹配的方法是指,將待分析的一段漢字與一個事先造好的詞典中的詞條進行匹配,在待分析漢字串中掃描到詞典中已有的詞條則匹配成功,或者說切分出一個單詞。

按照掃描方向,基于詞典的匹配法可以分為正向匹配和逆向匹配。按照匹配長度優先級的不同,又可以分為最大匹配和最小匹配。將掃描方向和長度優先混合,又可以產生正向最大匹配、逆向最大匹配等不同方法。

詞典匹配方法計算簡單,其準確度在很大程度上取決于詞典的完整性和更新情況。

基于統計的分詞方法指的是分析大量文字樣本,計算出字與字相鄰出現的統計概率,幾個字相鄰出現越多,就越可能形成一個單詞。基于統計的方法的優勢是對新出現的詞反應更快速,也有利于消除歧義。

基于詞典匹配和基于統計的分詞方法各有優劣,實際使用中的分詞系統都是混合使用兩種方法的,快速高效,又能識別生詞、新詞,消除歧義。

中文分詞的準確性往往影響搜索引擎排名的相關性。比如在百度搜索“搜索引擎優化”,從快照中可以看到,百度把“搜索引擎優化”這六個字當成一個詞。

而在Google搜索同樣的詞,快照顯示Google將其分切為“搜索引擎”和“優化”兩個詞。顯然百度切分得更為合理,搜索引擎優化是一個完整的概念。Google分詞時傾向于更為細碎。

這種分詞上的不同很可能是一些關鍵詞排名在不同搜索引擎有不同表現的原因之一。比如百度更喜歡將搜索詞完整匹配地出現在頁面上,也就是說搜索“招標師在線網” 時,這四個字連續完整出現更容易在百度獲得好的排名。Google就與此不同,不太要求完整匹配。一些頁面出現“招標師”和“在線網”兩個詞,但不必完整匹配地出現,“招標師”出現在前面,“在線網”出現在頁面的其他地方,這樣的頁面在Google搜索“招標師在線網”時,也可以獲得不錯的排名。

搜索引擎對頁面的分詞取決于詞庫的規模、準確性和分詞算法的好壞,而不是取決于頁面本身如何,所以SEO人員對分詞所能做的很少。唯一能做的是在頁面上用某種形式提示搜索引擎,某幾個字應該被當做一個詞處理,尤其是可能產生歧義的時候,比如在頁面標題、h1標簽及黑體中出現關鍵詞。如果頁面是關于“和服”的內 容,那么可以把“和服”這兩個字特意標為黑體。如果頁面是關于“化妝和服裝”,可以把“服裝”兩個字標為黑體。這樣,搜索引擎對頁面進行分析時就知道標為黑體的應該是一個詞。

3.去停止詞

無論是英文還是中文,頁面內容中都會有一些出現頻率很高,卻對內容沒有任何影響的詞,如“的”、“地”、“得”之類的助詞,“啊”、“哈”、“呀”之類的感嘆詞,“從而”、“以”、“卻”之類的副詞或介詞。 這些詞被稱為停止詞,因為它們對頁面的主要意思沒什么影響。英文中的常見停止詞有the,a,an,to,of等。

搜索引擎在索引頁面之前會去掉這些停止詞,使索引數據主題更為突出,減少無謂的計算量。

4.消除噪聲

絕大部分頁面上還有一部分內容對頁面主題也沒有什么貢獻,比如版權聲明文字、導航條、廣告等。以常見的博客導航為例,幾乎每個博客頁面上都會出現文章分類、 歷史存檔等導航內容,但是這些頁面本身與“分類”、“歷史”這些詞都沒有任何關系。用戶搜索“歷史”、“分類”這些關鍵詞時僅僅因為頁面上有這些詞出現而返回博客帖子是毫無意義的,完全不相關。所以這些區塊都屬于噪聲,對頁面主題只能起到分散作用。

搜索引擎需要識別并消除這些噪聲,排名時不使用噪聲內容。消噪的基本方法是根據HTML標簽對頁面分塊,區分出頁頭、導航、正文、頁腳、廣告等區域,在網站上大量重復出現的區塊往往屬于噪聲。對頁面進行消噪后,剩下的才是頁面主體內容。

5.去重

搜索引擎還需要對頁面進行去重處理。

同 一篇文章經常會重復出現在不同網站及同一個網站的不同網址上,搜索引擎并不喜歡這種重復性的內容。用戶搜索時,如果在前兩頁看到的都是來自不同網站的同一篇文章,用戶體驗就太差了,雖然都是內容相關的。搜索引擎希望只返回相同文章中的一篇,所以在進行索引前還需要識別和刪除重復內容,這個過程就稱為“去重”。(也有一種說法網絡上大量出現的文章搜索引擎認為很有用,于是會很快收錄)

去重的基本方法是對頁面特征關鍵詞計算指紋,也就是說從頁面主體內容中選取最有代表性的一部分關鍵詞(經常是出現頻率最高的關鍵詞),然后計算這些關鍵詞的數字指紋。這里的關鍵詞選取是在分詞、去停止詞、消噪之后。實驗表明,通常選取10個特征關鍵詞就可以達到比較高的計算準確性,再選取更多詞對去重準確性提高的貢獻也就不大了。

典型的指紋計算方法如MD5算法(信息摘要算法第五版)。這類指紋算法的特點是,輸入(特征關鍵詞)有任何微小的變化,都會導致計算出的指紋有很大差距。

了解了搜索引擎的去重算法,SEO人員就應該知道簡單地增加“的”、“地”、“得”、調換段落順序這種所謂的偽原創,并不能逃過“搜索引擎的法眼”,因為這樣的操作無法改變文章的特征關鍵詞。而且搜索引擎的去重算法很可能不止于頁面級別,而是進行到段落級別,混合不同文章、交叉調換段落順序也不能使轉載和抄襲變成原創。

6.正向索引

正向索引也可以簡稱為索引。

經過文字提取、分詞、 消噪、去重后,搜索引擎得到的就是獨特的、能反映頁面主體內容的、以詞為單位的內容。接下來搜索引擎索引程序就可以提取關鍵詞,按照分詞程序劃分好的詞, 把頁面轉換為一個關鍵詞組成的集合,同時記錄每一個關鍵詞在頁面上的出現頻率、出現次數、格式(如出現在標題標簽、黑體、H標簽、錨文字等)、位置(如頁 面第一段文字等)。這樣,每一個頁面都可以記錄為一串關鍵詞集合,其中每個關鍵詞的詞頻、格式、位置等權重信息也都記錄在案。

搜索引擎索引程序將頁面及關鍵詞形成詞表結構存儲進索引庫。簡化的索引詞表形式如表2-1所示。

每個文件都對應一個文件ID,文件內容被表示為一串關鍵詞的集合。實際上在搜索引擎索引庫中,關鍵詞也已經轉換為關鍵詞ID.這樣的數據結構就稱為正向索引。

7.倒排索引

正向索引還不能直接用于排名。假設用戶搜索關鍵詞2,如果只存在正向索引,排名程序需要掃描所有索引庫中的文件,找出包含關鍵詞2的文件,再進行相關性計算。這樣的計算量無法滿足實時返回排名結果的要求。

所以搜索引擎會將正向索引數據庫重新構造為倒排索引,把文件對應到關鍵詞的映射轉換為關鍵詞到文件的映射,如表2-2所示。

在倒排索引中關鍵詞是主鍵,每個關鍵詞都對應著一系列文件,這些文件中都出現了這個關鍵詞。這樣當用戶搜索某個關鍵詞時,排序程序在倒排索引中定位到這個關鍵詞,就可以馬上找出所有包含這個關鍵詞的文件。

8.鏈接關系計算

鏈接關系計算也是預處理中很重要的一部分。現在所有的主流搜索引擎排名因素中都包含網頁之間的鏈接流動信息。搜索引擎在抓取頁面內容后,必須事前計算出:頁面上有哪些鏈接指向哪些其他頁面,每個頁面有哪些導入鏈接,鏈接使用了什么錨文字,這些復雜的鏈接指向關系形成了網站和頁面的鏈接權重。

GooglePR值就是這種鏈接關系的最主要體現之一。其他搜索引擎也都進行類似計算,雖然它們并不稱為PR.

由于頁面和鏈接數量巨大,網上的鏈接關系又時時處在更新中,因此鏈接關系及PR的計算要耗費很長時間。關于PR和鏈接分析,后面還有專門的章節介紹。

9.特殊文件處理

除了HTML文件外,搜索引擎通常還能抓取和索引以文字為基礎的多種文件類型,如PDF、Word、WPS、XLS、PPT、TXT文件等。我們在搜索結果 中也經常會看到這些文件類型。但目前的搜索引擎還不能處理圖片、視頻、Flash這類非文字內容,也不能執行腳本和程序。

雖然搜索引擎在識別圖片及從Flash中提取文字內容方面有些進步,不過距離直接靠讀取圖片、視頻、Flash內容返回結果的目標還很遠。對圖片、視頻內容的排名還往往是依據與之相關的文字內容,詳細情況可以參考后面的整合搜索部分。

排名

經過搜索引擎蜘蛛抓取的界面,搜索引擎程序 計算得到倒排索引后,收索引擎就準備好可以隨時處理用戶搜索了。用戶在搜索框填入關鍵字后,排名程序調用索引庫數據,計算排名顯示給客戶,排名過程是與客戶直接互動的。


久草中文在线观看_久久精品中文字幕一区_亚洲日本欧美日韩中文字幕_熟妇人妻无乱码中文字幕真矢织江
<code id="6mcsu"></code>
<li id="6mcsu"></li>
<li id="6mcsu"><dl id="6mcsu"></dl></li>
  • <code id="6mcsu"><tr id="6mcsu"></tr></code>
    国产精品蜜臀在线观看| 天天爽夜夜爽夜夜爽精品视频| av电影一区二区| 亚洲日本一区二区| 欧美日韩www| 久久99久国产精品黄毛片色诱| 国产亚洲自拍一区| 色婷婷一区二区| 五月婷婷久久丁香| 2021久久国产精品不只是精品 | 亚洲成av人片一区二区| 精品日韩成人av| 成人免费电影视频| 亚洲高清三级视频| 久久众筹精品私拍模特| 色一区在线观看| 午夜精品爽啪视频| 国产网站一区二区三区| 91成人国产精品| 国产呦精品一区二区三区网站| 亚洲天堂久久久久久久| 欧美一区二区三区男人的天堂| 国产91综合网| 午夜精品久久久| 久久九九全国免费| 在线观看国产91| 狠狠色综合色综合网络| 亚洲免费观看高清| 亚洲精品在线电影| 欧美在线视频不卡| 粉嫩嫩av羞羞动漫久久久| 亚洲成av人在线观看| 国产精品婷婷午夜在线观看| 欧美日韩国产综合久久| 成人在线一区二区三区| 视频一区二区中文字幕| 国产精品久久久久久福利一牛影视| 91麻豆精品国产综合久久久久久| 成人高清视频免费观看| 日韩成人av影视| 最新国产成人在线观看| 精品日韩欧美在线| 欧美日韩中字一区| 成人激情免费网站| 激情深爱一区二区| 亚洲成av人**亚洲成av**| 国产精品久久福利| 精品卡一卡二卡三卡四在线| 欧洲视频一区二区| 成人一道本在线| 麻豆高清免费国产一区| 亚洲综合免费观看高清完整版在线| 久久久国际精品| 欧美一区二区三区系列电影| 91免费观看视频| 国产69精品久久久久毛片| 麻豆精品国产传媒mv男同 | 中文字幕亚洲在| 精品国产免费一区二区三区香蕉| 欧美丝袜自拍制服另类| va亚洲va日韩不卡在线观看| 韩国成人在线视频| 免费在线观看精品| 亚洲成人精品一区| 综合久久久久综合| 中文字幕成人在线观看| 欧美精品一区二区三区蜜桃 | 欧美日韩国产一区| 色综合一个色综合| 成人aaaa免费全部观看| 寂寞少妇一区二区三区| 日韩和欧美一区二区| 亚洲最色的网站| 最新高清无码专区| 国产精品美日韩| 国产视频在线观看一区二区三区| 精品福利视频一区二区三区| 日韩一区二区电影在线| 欧美一区二区观看视频| 欧美精品丝袜中出| 欧美三级欧美一级| 精品婷婷伊人一区三区三| 欧美性色aⅴ视频一区日韩精品| 色综合天天综合| 97se亚洲国产综合自在线不卡| 成人精品高清在线| 成人av资源下载| 成人自拍视频在线观看| 丰满少妇久久久久久久| 国产99久久久精品| 国产99精品国产| 成人h动漫精品一区二| 成人爱爱电影网址| 91在线丨porny丨国产| 91网站在线播放| 色综合久久久久综合99| 在线亚洲免费视频| 欧美三级蜜桃2在线观看| 欧美精品丝袜中出| 日韩欧美资源站| 欧美成人aa大片| 久久综合色天天久久综合图片| 久久日韩精品一区二区五区| 久久天天做天天爱综合色| 国产亚洲综合av| 国产精品久久久久aaaa樱花| 亚洲人精品一区| 亚洲国产精品天堂| 丝袜美腿一区二区三区| 蜜臀av一级做a爰片久久| 另类小说视频一区二区| 国产精品一区在线观看乱码 | 欧美性猛交xxxxxxxx| 欧美高清www午色夜在线视频| 91精品国产综合久久久久久久| 欧美一区二区三区系列电影| 精品成人私密视频| 国产精品久久看| 一区二区三区四区在线免费观看| 亚洲成人av一区二区三区| 麻豆精品一区二区av白丝在线| 国产乱码一区二区三区| 91在线视频在线| 在线91免费看| 欧美精品一区二区三区高清aⅴ | 精品久久久久久最新网址| 国产三级一区二区| 亚洲欧美经典视频| 日本一区中文字幕| 精品一区二区三区日韩| 成人黄色电影在线| 欧美日本在线看| 精品国产自在久精品国产| 国产精品久久午夜夜伦鲁鲁| 亚洲影院在线观看| 蜜桃传媒麻豆第一区在线观看| 国产成人自拍网| 日本电影亚洲天堂一区| 欧美成人综合网站| 亚洲人一二三区| 蜜臀久久久99精品久久久久久| 成人午夜激情影院| 欧美日韩国产影片| 国产欧美日韩在线观看| 亚洲精品国产一区二区三区四区在线| 青青草国产成人99久久| 高清不卡一区二区| 欧美三级中文字幕| 欧美激情综合网| 亚洲成年人影院| 风间由美一区二区三区在线观看 | 国产精品成人在线观看| 婷婷成人综合网| 国产aⅴ精品一区二区三区色成熟| 在线视频国内自拍亚洲视频| 久久久亚洲精品一区二区三区| 亚洲综合免费观看高清在线观看| 国产一区二区三区四区五区入口| 一本大道av一区二区在线播放| 日韩欧美电影在线| 一区二区在线观看免费视频播放| 国产综合色精品一区二区三区| 日本久久电影网| 久久免费的精品国产v∧| 亚洲国产sm捆绑调教视频| 成人免费视频app| 欧美一区二区成人| 一区二区三区日韩| 国产麻豆视频一区| 欧美另类高清zo欧美| 中文字幕日韩av资源站| 久久99在线观看| 欧美日韩在线综合| 国产精品乱子久久久久| 美女性感视频久久| 欧美视频在线观看一区| 国产精品三级久久久久三级| 蜜臀av性久久久久蜜臀aⅴ四虎| 色老汉一区二区三区| 国产偷国产偷亚洲高清人白洁| 日韩专区中文字幕一区二区| 97se亚洲国产综合自在线观| 久久久国际精品| 蜜臀久久99精品久久久久宅男| 欧美伊人久久久久久久久影院 | 麻豆专区一区二区三区四区五区| 色久综合一二码| 亚洲国产高清aⅴ视频| 成人精品在线视频观看| 日韩欧美一级精品久久| 亚洲妇熟xx妇色黄| 色综合天天综合狠狠| 国产蜜臀97一区二区三区| 久久精品理论片| 91精品欧美一区二区三区综合在| 亚洲乱码国产乱码精品精的特点| 国产成人在线看| www亚洲一区| 毛片av一区二区三区| 91精品免费观看|