<code id="6mcsu"></code>
<li id="6mcsu"></li>
<li id="6mcsu"><dl id="6mcsu"></dl></li>
  • <code id="6mcsu"><tr id="6mcsu"></tr></code>
    或者

    對李彥宏百度搜索結果排序專利的思考

    作者:山里的苦丁 瀏覽:115 發(fā)布時間:2017-09-01
    分享 評論 0

      百度《一種對搜索結果進行排序的方法及設備》專利,申請于2011-05-09, 發(fā)明人:李彥宏 張子云,申請?zhí)枺?01110118082.6


      專利原文下載地址:http://pan.baidu.com/s/1c2bjT2g


      簡單介紹該專利在說什么


      搜索引擎一般是通過搜索詞和文章的相關度來排序,然后把排序后的結果展現(xiàn)給用戶。這樣的結果雖然速度快,但是它有一個缺點,就是排在前面的不一定是用戶需要的搜索結果。所以就研發(fā)了該專利的方法來對結果進行修正。


      修正的條件包括但不限于以下幾個方面:


      ?1、搜索結果所引用資源的有效性


      2、搜索結果所在站點的權威性


      3、搜索結果的頁面級別


      4、搜索結果的頁面類型


      5、搜索結果的頁面質量


      6、搜索結果的頁面編碼類型


      7、搜索結果的頁面豐富程度


      ?8、在相同的檢索詞得到的搜索結果中是否被點擊過


      這個修正方法怎么工作的呢?


      ?通過對某類詞設置相應的修正條件和每個修正條件所占的權重,然后通過 每個修正值×權重 再相加,得到最后的 最終排序值,由高到低排序。具體的算法大家可以參閱專利文獻。


      思考來了,我列一些我的想法,大家補充


      ?1、不同的類型的網站的排序標準是不一樣的


      根據專利所述,新聞站,醫(yī)療站更重視權威性,資源站(影視,下載)更重視資源的有效性(是否可以在線觀看,可以下載)。所以我們在針對不同類型的網站優(yōu)化需要有所區(qū)別。


      2、頁面編碼確實是有影響的


      ?參加或者觀看過光年培訓視頻的同學應該記得,國平講過要注意網站的charset要設置正確,不要中文網站設置成英文,英文設置成中文,這個用國外模板或系統(tǒng)的同學得注意。


      ?3、是否被點擊過


      這個點擊過是指之前這個結果在同樣的檢索詞下,展現(xiàn)的時候是否有被用戶點擊過。有則標記為1,無則0。


      ?從技術的角度來講,這個可以將展示次數和點擊不成比例的搜索結果排除掉,因為有些不相關的搜索結果肯定是點擊率低的。


      ?之前點擊器橫行跟這個應該有關,這個修正方案可能不像專利列舉的只有0,1,可以還包括點擊次數等。


      ?4、資源有效性的評分方式


      ?評分是通過 -N ,0,+N 來進行的, 資源全部可用為正分,資源部份可用為0 ,資源全部不可用為負分


      ?得到負分的結果基本從結果中被排除了。 因為 算法是 分值×權重 然后再加上別的修正項得分的,負分嚴重影響最終結果,最終得分難以有排名。


      ?5、頁面級別


      專利列舉了:首頁,專題頁和其它底層頁面。越重要的頁面其得到的分值越大,我認為不只這幾種頁面,比如: 列表頁、搜索結果頁


      ?6、排序的效率


      為了更快的對結果進行排序,大部份值是被事先進行計算,然后保存起來,比如站點權威值,頁面級別這些修正值,但是一個搜索詞相關的結果可能很多,這時為了節(jié)約資源和得升效率,會提取相關度最高的N條結果來參與后續(xù)的修正排序,所以如果你相關度不夠擠入前N名里面,基本,你就是沒戲。這個在專利里是有說明的。


      7、蛛絲馬跡


      專利原文:“[0043] 在本實施例的方案中,為搜索結果的每種修正條件選擇的修正參數攜帶在搜索結果的URL中(如搜索結果的PageRank的修正參數),或攜帶在搜索結果的檢索詞-網頁(Query-URL)對中(如針對之前之用相同的檢索詞得到的搜索結果是否被點擊過的修正參數),因此,根據預設的修正條件,可以從搜索結果的URL或Query-URL對中查詢出已選擇的修正參數”。


      ?根據這條,可能在百度的結果頁或結果頁的URL能找到使用了哪些修正參數的蛛絲馬跡。


      PS:


      ?百度的專利并不是百分百就是這樣子,我們可以從中得到一些啟發(fā),技術一直在進步,現(xiàn)在的排序方法肯定是比這個先進而有效率,請勿過于執(zhí)著。大膽假設,小心求證。


    中文字幕乱码人妻一区二区三区| 久久久久久国产精品无码下载| 99精品人妻无码专区在线视频区| 中中文字幕亚洲无线码| 精品无码久久久久国产| 中文字幕人妻丝袜乱一区三区| 免费无遮挡无码永久视频| 人妻系列AV无码专区| 爆操夜夜操天天操狠操中文| 久久人妻少妇嫩草AV无码蜜桃| 无码中文人妻在线一区二区三区 | 人妻系列无码专区无码中出| 中文无码人妻有码人妻中文字幕| 精品久久久久久中文字幕大豆网 | 人妻中文字系列无码专区| 亚洲午夜国产精品无码老牛影视| 欧美激情中文字幕| 中文字幕人妻无码专区| 亚洲男人第一无码aⅴ网站| 成人无码精品1区2区3区免费看| 亚洲AV无码专区国产乱码4SE| 中文字幕无码成人免费视频| 乱人伦人妻中文字幕无码| 亚洲第一中文字幕| 日本精品久久久久中文字幕8 | 天堂资源中文最新版在线一区| 99久久精品无码一区二区毛片 | 国产无码区| 久久国产精品无码网站| 免费a级毛片无码免费视频120软件 | 午夜无码一区二区三区在线观看 | 国99精品无码一区二区三区| 久久精品aⅴ无码中文字字幕重口| 无码午夜成人1000部免费视频| 国产成人无码av| 亚洲av无码片vr一区二区三区| 亚洲精品无码不卡在线播放HE| 少妇无码AV无码一区| 中文字幕丰满乱子伦无码专区| 在线播放无码高潮的视频| 亚洲AV无码精品色午夜在线观看|