原來O2O搜索有這么多門道!美團仙云森揭秘如何讓服務(wù)更智能
原創(chuàng)【51CTO.com原創(chuàng)稿件】2018年5月18-19日,由51CTO主辦的全球軟件與運維技術(shù)峰會在北京召開。此次峰會圍繞人工智能、大數(shù)據(jù)、物聯(lián)網(wǎng)、區(qū)塊鏈等12大核心熱點,匯聚海內(nèi)外60位一線專家,是一場高端的技術(shù)盛宴,也是頂級IT技術(shù)人才學(xué)習(xí)和人脈拓展不容錯過的平臺。
在5月18日上午“人工智能技術(shù)探索”B會場論壇中,美團搜索算法負責(zé)人仙云森帶來了《O2O服務(wù)搜索的智能化》的主題分享,并展示了美團平臺搜索技術(shù)中心基礎(chǔ)算法的一些研究成果和心得。
O2O搜索的價值:連接人與服務(wù)
仙云森首先介紹了O2O(即Online To Offline/線上到線下)搜索的整體特點,以及它與網(wǎng)頁搜索或者購物搜索的一些差異。他介紹到,美團是一個生活服務(wù)電商平臺,有幾十條業(yè)務(wù)線,每個業(yè)務(wù)之間存在非常大的差異。他列舉了三個業(yè)務(wù)做對比,首先是足療按摩,足療按摩是一個非常輕決策的業(yè)務(wù),用戶更多的關(guān)注地點,一公里內(nèi)的消費比例非常高,對體驗感受并不重要。與之相比,家裝就不同了,因為裝修一次會使用多年,用戶對距離、優(yōu)惠的敏感度降低,更多的關(guān)注品質(zhì),結(jié)婚就更側(cè)重品質(zhì)和用戶體驗了。這些不同的搜索需求給搜索業(yè)務(wù)帶來非常大的挑戰(zhàn)。
搜索的使命是什么?仙云森認為搜索就是要連接人與服務(wù),把用戶和商家連接起來。如果只用兩個字來形容,那就是“效率”。“這里面有兩層含義,一層就是交易效率,另外一層就是決策效率。”他認為搜索對于商家端的價值也有兩點:一個就是用戶觸達,通過搜索讓更多的用戶到店里來,二是轉(zhuǎn)化效率,讓用戶在店里消費,在成單的同時優(yōu)化。
仙云森還從四個層面將O2O與網(wǎng)頁搜索、購物電商做一個對比。
第一個區(qū)別是移動化。美團移動端的占比在94%以上,淘寶移動化比例也達到了90%,而百度的移動占比就稍弱一些。第二個區(qū)別是個性化。這項對比中百度較低,因為百度的理念是“信息是平等的,不需要個性化”。而美團和淘寶的個性化選擇則非常高。第三個區(qū)別是場景化,例如訂酒店,定景點門票往往都是異地達成的,地域空間的影響非常小。第四點是實時化,仙云森認為淘寶的實時化與場景關(guān)聯(lián)較少,但在雙十一、反作弊這些具體的場景上實時性是有加強的。
如何讓O2O搜索智能化?
在了解O2O搜索的特點和基本特征后,那么如何去實現(xiàn)O2O搜索的智能化呢?仙云森認為智能化目標有兩個,一是精準需求一鍵觸達,二是通過優(yōu)化體驗提升決策效率。關(guān)鍵路徑也有兩點:精準的理解用戶意圖和智能化的排序算法。
在仙云森列出的搜索技術(shù)全景圖中,從基礎(chǔ)層、策略層到業(yè)務(wù)層,他分別梳理了通用業(yè)務(wù)和垂直業(yè)務(wù)對應(yīng)的搜索策略和技術(shù)。
在現(xiàn)場仙云森還強調(diào)了意圖理解的作用,即如何理解用戶的意圖。他介紹到,美團上的用戶意圖可以被分解成幾個關(guān)鍵要素,如地點、時間,地點可以通過查找周邊來解決,不同的時間用戶的需求也不一樣,如工作日的中午,用戶可能只對快餐外賣有需求,而到了節(jié)假日,可以就會搜索大餐美食。此外像天氣,雨雪天氣、霧霾天氣,都會影響用戶的消費行為。
當談到意圖與召回時,仙云森表示,美團是一個結(jié)構(gòu)化的搜索,與網(wǎng)頁不同,美團頁面上每一個商鋪有固定的幾個字段,而且都是規(guī)范化的異地人工上單。當美團在意圖上構(gòu)建意圖體系時,有四點非常重要,一是業(yè)務(wù)識別要使用多意圖識別,二是消費位置需要識別出是本地還是異地,三是消費時間要判斷出是即時消費還是延遲消費,看用戶是有排隊需求還是預(yù)訂需求。還有一點是成份分析,如果搜索系統(tǒng)能夠把它的成份識別清楚,就能夠召回得更精準,更有機會準確地滿足用戶的需求。
例如當用戶輸?shù)膖erms是北京南站,那么他的消費品類在酒店上的需求基本是壓倒性的優(yōu)勢,而假如用戶的terms是三里屯時,對于酒吧搜索的需求量會非常大,搜索望京、五道口時,韓國菜就會有一定的需求比例。“這就是我們根據(jù)用戶一些真實行為,能夠有機會判斷出來每一個差別的意圖分布。”
深度學(xué)習(xí)帶來效果提升
演講最后,仙云森還分享了美團在實時化方面的實踐。他們首先做特征的實時化,在用戶的實時行為、實時庫存、實時意圖和實時轉(zhuǎn)化上做一些特殊工程,他們的模型其實是基于歷史的數(shù)據(jù)發(fā)現(xiàn)規(guī)律,從而預(yù)測未來。如果僅僅是數(shù)據(jù)有變化而規(guī)律沒變,那用特征預(yù)測就夠了。后來他們開始嘗試模型的實時化,并經(jīng)過了三輪的迭代,首先是基礎(chǔ)模型GBDT+LR(Gradient boosting decision/regression tree,LTR中應(yīng)用較多的非線性模型),這也是Facebook比較經(jīng)典的結(jié)構(gòu),在這個基礎(chǔ)上他們做了一些改進,把sbas的特征直接加入到LR這一端,效果又得到了提升。
當談到時下很熱門的深度學(xué)習(xí)時,仙云森表示,深度學(xué)習(xí)對美團有很大幫助。過去從業(yè)務(wù)特色看,有很多交叉的搜索因素如用戶場景、用戶狀態(tài),用戶查詢等等,僅僅依靠人工的力量,擰合力是不夠的。后來他們嘗試通過深度學(xué)習(xí),參考DeepFM模型,部分特征組合加入wide,并將FM部分改為分組product,在基礎(chǔ)網(wǎng)絡(luò)中取得了一個非常正向的效果。此外由于美團是一個關(guān)注交易的服務(wù)商,因此相關(guān)性也非常重要。深度學(xué)習(xí)是比較適合做多任務(wù)學(xué)習(xí)的,所以他們嘗試了兩種結(jié)構(gòu),一個是共享wide,一個是共享deep,最終選擇了共享wide,因為不共享wide的成本會更大。
以上內(nèi)容是51CTO記者根據(jù)仙云森在WOT2018全球軟件與運維技術(shù)峰會的演講內(nèi)容整理,更多關(guān)于WOT的內(nèi)容請關(guān)注51cto.com。
【51CTO原創(chuàng)稿件,合作站點轉(zhuǎn)載請注明原文作者和出處為51CTO.com】
























