<code id="6mcsu"></code>
<li id="6mcsu"></li>
<li id="6mcsu"><dl id="6mcsu"></dl></li>
  • <code id="6mcsu"><tr id="6mcsu"></tr></code>
    或者

    人工智能在搜索算法中的應用

    作者:紫色年華 瀏覽:150 發布時間:2017-11-03
    分享 評論 0

        2016 年以來,IT行業最大的技術突破應該是人工智能了,不僅在一年左右時間,在最后一個人類曾經自以為機器很難戰勝人類的游戲項目上完勝人類,前幾天更是出現了逆天的AlphaGo Zero,完全不用借鑒人類知識,自學 3 天就超越了人類。


        人工智能領域最牛X的公司,國外是Google,國內是百度。都是搜索引擎。這恐怕也不是什么巧合,而是因為搜索引擎是最適合開發人工智能的公司,他們擁有最大量的數據,包括文字、圖片、視頻,還有地圖、路況、用戶使用數據等等。


        搜索引擎公司的AI成果在多大程度上運用到了他們的核心業務-搜索中?他們都沒有明確地對外說明,從搜索工程師的零碎發言中猜測,至少目前還沒有大規模使用,并沒有改變搜索算法的基礎。畢竟人工智能雖然概念存在了幾十年,但效果突飛猛進只是近幾年的事,還沒有出現通用人工智能,在圍棋這種規則簡單明確的領域中牛X,遷移到規則模糊的系統中,比如搜索,還需要一些時間。


        但我想,人工智能大規模應用于搜索算法是早晚的事。據說以前百度大搜索部門和人工智能/深度學習部門之間是有些矛盾的,現在吳恩達離開了百度,陸奇對百度又進行了很多人事調整,搜索部門對人工智能的排斥也許就大大降低了。


        其實人工智能已經在搜索算法中有所運用。舉兩個例子。


        百度DNN模型


        前幾個月看到了百度朱凱華的一篇《AI賦能的搜索和對話交互》演講報道。數年前和朱凱華還做過一次訪談,那時候他還是Google的主任架構師,是著名的熊貓算法的主要參與者之一,現在他是百度的首席架構師了。演講內容很多,感興趣的搜索標題就能找到全文,很值得深入讀一下。這么長時間SEO行業很少人注意到這篇這么有價值的關于搜索算法的公開信息,還是挺意外的。


        演講里提到了百度 2013 年上線的DNN模型,極大提高了語義相關性的判斷范圍和準確性, 2013 年百度相關性提高的34%來自于DNN模型, 2014 年全年相關性提升的25%來自DNN模型。DNN模型使用的就是深度學習方法,通過 100 億的用戶點擊數據訓練模型,有超過 1 億個參數。下面介紹的Google RankBrain是 2015 年上線的,所以百度是世界上第一個將人工智能應用到實際搜索算法中的公司。


        簡單說,就是對同一個查詢詞,模型分析了真實用戶點擊了的頁面的標題,和沒有點擊的頁面標題,從而更深入理解哪些標題是滿足了用戶需求的。經常出現的情況是,頁面標題并不包含查詢詞,用戶卻更愿意點擊這些頁面,說明這些頁面滿足了用戶需求,這些頁面的標題,即使不包含查詢詞,也是與查詢詞語義相關的。這是經典的頁面-關鍵詞相關性算法無法計算出來的。


        演講中提到的例子:


        百度DNN模型案例


        在DNN上線之前,用戶搜索“ghibli車頭任何放置車牌”時,由于相關信息很少,沒有什么頁面是以這個查詢詞為標題或者頁面出現這些關鍵詞的,所以搜索結果質量不高,傳統搜索算法只能按關鍵詞匹配返回一些ghibli相關信息,卻沒幾乎有“車頭任何放置車牌”的信息。


        DNN上線之后的搜索結果是這樣的:


        百度DNN模型上線效果


        可以看到,搜索結果中還是沒有以“ghibli車頭任何放置車牌”為標題的頁面,但解決了用戶的需要,算法理解了“前”、“前面”和“車頭”是一個意思,“放哪里啊”、“怎么裝”、“咋掛”和“任何放置”是一個意思,所以“ghibli車牌咋掛”這種頁面回答了“ghibli車頭任何放置車牌”這個查詢,雖然他們包含的關鍵詞是不一樣的。


        這種對相關性的理解不是傳統以關鍵詞匹配為基礎的搜索算法能算出來的,而是真實用戶的點擊數據告訴搜索算法的。用戶搜索“ghibli車頭任何放置車牌”時,經常點擊“ghibli車牌咋掛”、“ghibli前面車牌照怎么裝”這些頁面,DNN模型被訓練后知道,這些詞之間是語義相關的。


        Google RankBrain


        2015 年上線的Google RankBrain解決的也是對查詢詞的深入理解問題,尤其是比較長尾的詞,找到與用戶查詢詞不完全匹配、但其實很好回答了用戶查詢的那些頁面。和百度DNN是非常類似的。Google沒有具體說明RankBrain的訓練方法,估計和百度DNN也是類似的。


        2015 年RankBrain上線時,15%的查詢詞經過RankBrain處理, 2016 年所有查詢詞都要結果RankBrain處理。


        Google自己經常舉的RankBrain例子是這個查詢:


        What's the title of the consumer at the highest level of a food chain


        這個查詢詞相當長尾,完全匹配的結果比較少,而且查詢中的幾個詞容易有歧義,比如consumer通常是消費者的意思,food chain也可以理解為餐飲連鎖,但這個完整的查詢和商場、消費者、飯館之類的意思沒有任何關系,RankBrain能理解其實用戶問的是食物鏈頂端的物種是什么名字。同樣,搜索結果不能按照傳統的關鍵詞匹配來處理。


        這種長尾查詢數量很大,每天Google收到的查詢里有15%是以前都沒出現過的。這種查詢要靠關鍵詞匹配就比較難以找到高質量頁面,數量太少,甚至沒有,但理解了查詢的語義和意圖,就能找到滿足用戶需求的、關鍵詞并不完全匹配的頁面。


        對SEO的影響以后再詳細寫,這里只是先簡單提示一下:頁面要包含關鍵詞,這在目前的關鍵詞優化過程中是必然的,現在搜索引擎能理解兩句不同的話意思是一樣的了,以后創作或編輯頁面內容時,是不是還一定要包含關鍵詞呢?


    国产在线拍揄自揄拍无码| 少妇无码太爽了在线播放| 无码粉嫩小泬无套在线观看| 18禁黄无码高潮喷水乱伦| 中文字幕在线观看国产| 亚洲成A∨人片天堂网无码| 无码人妻一区二区三区在线| 最好看更新中文字幕| 色吊丝中文字幕| 国产成A人亚洲精V品无码性色 | 亚洲国产精品无码久久久蜜芽| 无码人妻精品中文字幕免费东京热| 无码无套少妇毛多18p| 亚洲日韩欧美国产中文| 亚洲中文字幕无码永久在线| av无码久久久久不卡免费网站| 亚洲精品色午夜无码专区日韩| 欧美无乱码久久久免费午夜一区二区三区中文字幕 | 日韩高清在线中文字带字幕| 日韩乱码人妻无码系列中文字幕| 亚洲韩国—中文字幕| 久久中文字幕无码专区| 人妻av无码一区二区三区| 精品欧洲AV无码一区二区男男| 中文字幕AV一区中文字幕天堂| 无码日韩精品一区二区免费暖暖| 亚洲欧美在线一区中文字幕| 亚洲 欧美 国产 日韩 中文字幕| 免费看又黄又无码的网站| 成人无码网WWW在线观看| 最近2019年中文字幕6| 中文字幕亚洲欧美专区| 无码丰满熟妇一区二区| 国产亚洲精品无码专区| 精品无码日韩一区二区三区不卡| 久久午夜无码鲁丝片秋霞 | 天天爽亚洲中文字幕| 久久久精品无码专区不卡 | 人妻少妇精品无码专区动漫| 成人无码午夜在线观看| 精品亚洲成在人线AV无码|