偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<u id="amsa0"><label id="amsa0"><pre id="amsa0"></pre></label></u>

<ruby id="amsa0"></ruby>

<form id="amsa0"></form>

<button id="amsa0"><bdo id="amsa0"></bdo></button>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專(zhuān)欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

電商搜索算法技術(shù)的演進(jìn)

作者：青峰 2018-10-12 15:15:45

開(kāi)發(fā) 開(kāi)發(fā)工具算法

搜索與推薦算法經(jīng)過(guò)多年的發(fā)展，從最初簡(jiǎn)單的統(tǒng)計(jì)模型，機(jī)器學(xué)習(xí)到形成完整的離線在線與實(shí)時(shí)的深度學(xué)習(xí)與智能決策體系，每年都有新的算法突破，幫助搜索與推薦的體驗(yàn)與效果取得大幅提升，成為驅(qū)動(dòng)電商商業(yè)創(chuàng)新與發(fā)展的新引擎。

2018年9月28日，阿里電商搜索事業(yè)部迎來(lái)了一場(chǎng)以“搜·薦未來(lái)”為主題的技術(shù)峰會(huì)。

搜索與推薦算法經(jīng)過(guò)多年的發(fā)展，從最初簡(jiǎn)單的統(tǒng)計(jì)模型，機(jī)器學(xué)習(xí)到形成完整的離線在線與實(shí)時(shí)的深度學(xué)習(xí)與智能決策體系，每年都有新的算法突破，幫助搜索與推薦的體驗(yàn)與效果取得大幅提升，成為驅(qū)動(dòng)電商商業(yè)創(chuàng)新與發(fā)展的新引擎。站在今天總結(jié)過(guò)去的算法演進(jìn)，同時(shí)看未來(lái)電商搜索推薦算法的發(fā)展，期待從機(jī)器智能到結(jié)合人類(lèi)智能做到真正地認(rèn)知智能，實(shí)現(xiàn)搜索推薦新的交互新體驗(yàn)。

今天，我們邀請(qǐng)青峰老師，帶你回顧搜索算法技術(shù)的發(fā)展之路。

一、淘寶搜索的一些特點(diǎn)

淘寶有幾十億商品，掛靠在幾千個(gè)葉子類(lèi)目，上百個(gè)一級(jí)類(lèi)目，十幾個(gè)行業(yè)下面。如何能讓用戶(hù)找到符合意圖的商品，是淘寶搜索需要解決的首要問(wèn)題。

淘寶搜索從大的架構(gòu)或流程上來(lái)說(shuō)，與傳統(tǒng)的搜索引擎有不少相似的地方。包括對(duì)數(shù)據(jù)的整理、分析、索引產(chǎn)生索引庫(kù)，如何根據(jù)用戶(hù)輸入的關(guān)鍵詞在索引倒排表中進(jìn)行檢索，完成商品與檢索之間的相關(guān)度評(píng)價(jià)，對(duì)將要輸出的結(jié)果進(jìn)行排序，并實(shí)現(xiàn)某種用戶(hù)相關(guān)性反饋機(jī)制等。

當(dāng)然作為電商的商品搜索來(lái)說(shuō)，它天然的商業(yè)屬性帶來(lái)的更多是自身獨(dú)特的技術(shù)特點(diǎn)。

從數(shù)據(jù)更新角度來(lái)看，淘寶的數(shù)據(jù)變化和更新非?？臁Ｃ刻齑罅康男律唐窋?shù)據(jù)被上傳到網(wǎng)站，一旦新商品被上傳，這個(gè)商品就需要被搜索到。不像網(wǎng)頁(yè)搜索，任何人可以發(fā)布新的網(wǎng)頁(yè)，但是否被搜索引擎收錄是另一回事。同時(shí)在淘寶每天有大量的商品不停地在做更新，包括商品標(biāo)題描述的變化，商品價(jià)格的改變，商品圖片的更新，商品的上下架等等，這些變化也需要實(shí)時(shí)的更新到搜索中，以便讓用戶(hù)及時(shí)找到更新后的商品信息。而在全網(wǎng)搜索中，很多網(wǎng)頁(yè)是靜態(tài)不變，網(wǎng)頁(yè)之間的相互關(guān)系也變化緩慢，大量索引的更新沒(méi)有類(lèi)似淘寶搜索這種實(shí)時(shí)性的需求。

從搜索數(shù)據(jù)源來(lái)看，淘寶商品的圖片在用戶(hù)研究和購(gòu)買(mǎi)過(guò)程中起到了很大作用，搜索的展現(xiàn)結(jié)果中有很大一部分被圖片所占據(jù)。如何更有效地利用圖片的信息，無(wú)論是根據(jù)圖片來(lái)做檢索，或是考慮圖片的質(zhì)量，圖片與文本的相互關(guān)系等都是淘寶搜索需要考慮和處理的。

另外一個(gè)特點(diǎn)是全鏈路特性。搜索，比較以及購(gòu)買(mǎi)都發(fā)生在淘寶站內(nèi)，不像一般的全網(wǎng)搜索引擎，用戶(hù)搜索完后就跳離到其它網(wǎng)站，搜索前和搜索后的用戶(hù)行數(shù)據(jù)是很難拿到的。而在淘寶搜索，用戶(hù)搜索完后，會(huì)點(diǎn)擊其中一些商品，然后比較這些商品，和賣(mài)家進(jìn)行溝通，然后下單購(gòu)買(mǎi)，或者返回來(lái)繼續(xù)搜索，搜索前，搜索中和搜索后的數(shù)據(jù)和信息非常豐富，有全鏈路的用戶(hù)行為數(shù)據(jù)能幫助我們?cè)O(shè)計(jì)一個(gè)更好的搜索排序算法。

***更重要的一點(diǎn)淘寶是一個(gè)生態(tài)系統(tǒng)。而搜索排序算法的設(shè)計(jì)不只是體現(xiàn)了搜索本身的技術(shù)追求，也包含了更多的商業(yè)訴求。在全網(wǎng)搜索中，一般的網(wǎng)頁(yè)是不是被索引，被索引后是不是能展現(xiàn)，對(duì)網(wǎng)頁(yè)的擁有者來(lái)說(shuō)并不是一個(gè)事關(guān)生活的決定點(diǎn)。在淘寶上則完全不同，很多商家依賴(lài)于淘寶來(lái)解決民生就業(yè)問(wèn)題，網(wǎng)店的流量以及成交關(guān)系到很多人的生活。在淘寶搜索的算法設(shè)計(jì)中，既要考慮用戶(hù)的搜索體驗(yàn)，也要考慮商業(yè)規(guī)則來(lái)保障公平性和流量的分散性。很多的搜索算法原理，規(guī)則或算法結(jié)果都會(huì)向賣(mài)家宣導(dǎo)，引導(dǎo)賣(mài)家向更好的方向發(fā)展。

二、搜索算法技術(shù)演進(jìn)

作為淘寶海量消費(fèi)者與平臺(tái)的互動(dòng)行為，大量商家在平臺(tái)進(jìn)行的商業(yè)活動(dòng)的最主要承載者，淘寶搜索是大數(shù)據(jù)智能化應(yīng)用的***場(chǎng)景;在淘寶搜索算法多年的發(fā)展過(guò)程中，依托于工程架構(gòu)體系的逐步完善，逐步實(shí)現(xiàn)從簡(jiǎn)單人工運(yùn)營(yíng)加簡(jiǎn)單算法規(guī)則的時(shí)代，到形成完整的離線在線與實(shí)時(shí)的深度學(xué)習(xí)與智能決策體系，成為阿里電商平臺(tái)流量分發(fā)與商業(yè)驅(qū)動(dòng)的智能中樞，總結(jié)搜索算法技術(shù)的迭代進(jìn)步，大概可以分成如下四個(gè)階段：

2.1檢索時(shí)代

這個(gè)階段和業(yè)務(wù)相對(duì)應(yīng)，搜索排序主要圍繞規(guī)則和輪播展開(kāi)。這個(gè)階段數(shù)據(jù)量和用戶(hù)量還處于可控程度，具有領(lǐng)域知識(shí)的專(zhuān)業(yè)運(yùn)營(yíng)和產(chǎn)品往往充當(dāng)信息展示規(guī)則的制定者，根據(jù)主觀的判斷和對(duì)市場(chǎng)的敏銳度來(lái)制定查詢(xún)?cè)~背后的商品展示邏輯。當(dāng)然這個(gè)階段搜索也會(huì)運(yùn)用一些基本的算法邏輯來(lái)保證信息匹配的正確性和人貨匹配的公平性，基于傳統(tǒng)搜索引擎技術(shù)的相關(guān)性模型，保證用戶(hù)查詢(xún)?cè)~語(yǔ)商品標(biāo)題的有效匹配;基于商品成交與否的銷(xiāo)售人氣模型，保證有助于被消費(fèi)者接受的商品得到更多的展示機(jī)會(huì)。

但總體來(lái)說(shuō)還是基于人工規(guī)則把各種相關(guān)因子進(jìn)行組合，得出***的排序。“人工規(guī)則”的好處是容易理解和操控，壞處則不言而喻，隨著平臺(tái)規(guī)模的增大，簡(jiǎn)單規(guī)則無(wú)法精細(xì)的表達(dá)人貨匹配的效率，并且容易被一些不良商家利用規(guī)則來(lái)擾亂市場(chǎng)秩序;

2.2大規(guī)模機(jī)器學(xué)習(xí)時(shí)代

隨著平臺(tái)規(guī)模的擴(kuò)大，大規(guī)模商家入駐，積極地在平臺(tái)上打理店鋪，發(fā)布商品，相對(duì)結(jié)構(gòu)化的商品組織體系，類(lèi)目結(jié)構(gòu)，屬性信息，基于商品為key 的銷(xiāo)量的累積，評(píng)論的累積，這些為更好地理解商品積累了重要的原始數(shù)據(jù)資料;消費(fèi)者通過(guò)搜索產(chǎn)品的各級(jí)頁(yè)面與平臺(tái)的互動(dòng)越來(lái)越頻繁;數(shù)據(jù)的組織形成了以人為key 的結(jié)構(gòu)體系，反饋信號(hào)也得以在閉環(huán)系統(tǒng)中有效的流轉(zhuǎn);所有的這些都為理解用戶(hù)積累了重要的數(shù)據(jù)資料。

有效數(shù)據(jù)的積累為大規(guī)模運(yùn)用機(jī)器學(xué)習(xí)技術(shù)解決問(wèn)題提供了必要的土壤。搜索也進(jìn)入到各種大規(guī)模模型的研究和開(kāi)發(fā)，比如點(diǎn)擊預(yù)估模型等，研究數(shù)據(jù)特征規(guī)模大、特征復(fù)雜度高、數(shù)據(jù)時(shí)效性高、模型訓(xùn)練頻繁等相關(guān)的問(wèn)題，利用不斷增強(qiáng)的計(jì)算處理能力，對(duì)百萬(wàn)乃至十億量級(jí)以上的超大規(guī)模數(shù)據(jù)進(jìn)行分析和挖掘。這時(shí)候參與排序的因子也越來(lái)越多，從一開(kāi)始的類(lèi)目相關(guān)性與文本相關(guān)性，商品人氣分;再后來(lái)為了平衡賣(mài)家流量，加入的賣(mài)家分;再后來(lái)為了更好的用戶(hù)體驗(yàn)，加入了個(gè)性化人與商品的點(diǎn)擊預(yù)估，圖像質(zhì)量等因素等等，開(kāi)始使用類(lèi)似Learning to Rank(LTR)方法，根據(jù)商品的點(diǎn)擊、成交數(shù)據(jù)構(gòu)造學(xué)習(xí)樣本，學(xué)習(xí)回歸出排序權(quán)重。

2.3大規(guī)模實(shí)時(shí)在線學(xué)習(xí)時(shí)代

首先，相比通用搜索，電商搜索中對(duì)于實(shí)時(shí)計(jì)算/學(xué)習(xí)有著更高的要求，用戶(hù)會(huì)有著更豐富的多維度的交互，更長(zhǎng)的瀏覽鏈路。因此，如果用戶(hù)在鏈路前期的行為可以實(shí)時(shí)地被系統(tǒng)捕捉并且建模到引擎中并且作用于鏈路后期，對(duì)整個(gè)鏈路的效率以及用戶(hù)體驗(yàn)都是及其關(guān)鍵的。

其次，用戶(hù)的行為分布也不是一成不變的，從而打破離線訓(xùn)練的監(jiān)督學(xué)習(xí)算法所依賴(lài)的獨(dú)立同分布假設(shè)，尤其是在雙11這樣的大促場(chǎng)景，一天的流量和日常數(shù)天的相當(dāng)，分布變化會(huì)更加的劇烈。

***，由于搜索展示商品的有限，能夠進(jìn)入日志系統(tǒng)得到用戶(hù)反饋的商品集合只占商品全集的一部分，因此離線訓(xùn)練和線上會(huì)有不一致性，這個(gè)不一致性在一定程度上可以通過(guò)在線學(xué)習(xí)系統(tǒng)緩解。

于是，我們建設(shè)了一套實(shí)時(shí)計(jì)算和在線學(xué)習(xí)系統(tǒng)，支持在秒級(jí)別內(nèi)對(duì)海量用戶(hù)行為及其相關(guān)聯(lián)的海量商品作實(shí)時(shí)分析處理，從中提取多維度的用戶(hù)/商品數(shù)據(jù)特征，并采用分布式Parameter Server架構(gòu)進(jìn)行在線學(xué)習(xí)，從而使用戶(hù)行為可以在幾秒內(nèi)影響搜索排序等在線服務(wù)。

我們逐步實(shí)現(xiàn)了“實(shí)時(shí)特征”->“實(shí)時(shí)排序因子模型”->“實(shí)時(shí)頂層LTR/Bandit模型”，完成了三位一體的實(shí)時(shí)化建設(shè)。我們先后實(shí)現(xiàn)了秒級(jí)更新的基于pointwise的FTRL、基于pairwise的實(shí)時(shí)矩陣分解模型和實(shí)時(shí)雙線性模型等一系列微觀特征，并在此基礎(chǔ)之上實(shí)現(xiàn)了實(shí)時(shí)Learning to rank，以及實(shí)時(shí)Multi-Armed Bandit等宏觀調(diào)控模型，實(shí)現(xiàn)了雙鏈路實(shí)時(shí)系統(tǒng)的升級(jí)。

與此同時(shí)，在線學(xué)習(xí)系統(tǒng)強(qiáng)有力地支持了對(duì)流量的精準(zhǔn)調(diào)控，可以更迅速有效地實(shí)現(xiàn)商業(yè)決策。此外，我們還將在線學(xué)習(xí)的算法部分抽象出來(lái)，建立了一個(gè)通用的一站式在線機(jī)器學(xué)習(xí)算法平臺(tái)AOP(Algorithm One-stop Platform)，使得建立和部署在線學(xué)習(xí)模型更加得便捷和高效，同時(shí)具有高度可擴(kuò)展性。到目前為止，在線學(xué)習(xí)系統(tǒng)已經(jīng)成為搜索架構(gòu)中的基礎(chǔ)組件之一，在提升用戶(hù)搜索體驗(yàn)，支持商業(yè)決策，以及支撐雙11等大促效果方面發(fā)揮了巨大作用。

2.4深度學(xué)習(xí)與智能決策時(shí)代

以深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)為代表的人工智能給搜索技術(shù)帶來(lái)了全新的變化，特別是在語(yǔ)義搜索，搜索個(gè)性化和智能決策三個(gè)方向。

在語(yǔ)義搜索領(lǐng)域，我們?cè)O(shè)計(jì)并實(shí)現(xiàn)了Query的表征學(xué)習(xí)框架，通過(guò)多任務(wù)學(xué)習(xí)和協(xié)同訓(xùn)練等技術(shù)，為Query的打標(biāo)、類(lèi)目預(yù)測(cè)、改寫(xiě)以及推薦等一系列應(yīng)用提供統(tǒng)一的表征向量。與此同時(shí)，我們還實(shí)現(xiàn)了商品的表征學(xué)習(xí)框架，為商品內(nèi)容理解，商品智能創(chuàng)意，商品語(yǔ)義召回和語(yǔ)義匹配提供統(tǒng)一的商品表征。在Query和商品的表征框架基礎(chǔ)之上，我們實(shí)現(xiàn)了語(yǔ)義召回和語(yǔ)義相似度模型，從而完成了從字面匹配到語(yǔ)義匹配的這一質(zhì)的突變。此外，語(yǔ)義搜索除了增加搜索結(jié)果相關(guān)性，提升用戶(hù)體驗(yàn)外，也可以一定程度上遏制淘寶商品標(biāo)題堆砌熱門(mén)關(guān)鍵詞的問(wèn)題。

在搜索個(gè)性化領(lǐng)域，我們通過(guò)多項(xiàng)技術(shù)對(duì)原先的個(gè)性化系統(tǒng)進(jìn)行了升級(jí)：通過(guò)多任務(wù)學(xué)習(xí)的深度用戶(hù)感知模型，我們可以從海量用戶(hù)行為日志中學(xué)習(xí)用戶(hù)的通用表達(dá)，從而用于用戶(hù)行為識(shí)別、偏好預(yù)估、個(gè)性化召回、個(gè)性化排序等任務(wù);通過(guò)多模態(tài)融合學(xué)習(xí)，我們可以將商品的文本、圖像、標(biāo)簽、品牌、類(lèi)目、店鋪及統(tǒng)計(jì)特征等多維度特征自動(dòng)的融合在一起形成統(tǒng)一的商品表征;通過(guò)在線深度排序?qū)W習(xí)，我們?nèi)诤狭擞脩?hù)狀態(tài)實(shí)現(xiàn)更加精準(zhǔn)的千人千面的排序模型;通過(guò)向量召回引擎，我們得到了泛化更好的召回結(jié)果，有效提升了關(guān)鍵字和個(gè)性化匹配深度;通過(guò)深度遷移學(xué)習(xí)，我們將搜索個(gè)性化技術(shù)在搜索之外的多個(gè)場(chǎng)景得到廣泛應(yīng)用。隨著這些深度模型在個(gè)性化領(lǐng)域的廣泛使用，個(gè)性化系統(tǒng)的精準(zhǔn)度得到了顯著性的提升。

在智能決策領(lǐng)域，我們針對(duì)用戶(hù)在搜索過(guò)程中和引擎的交互特點(diǎn)，對(duì)用戶(hù)的決策序列進(jìn)行建模，提出了提出搜索會(huì)話?cǎi)R爾科夫決策過(guò)程模型，將強(qiáng)化學(xué)習(xí)引導(dǎo)到搜索排序。同時(shí)在針對(duì)不同場(chǎng)景下搜索結(jié)果趨同，浪費(fèi)曝光問(wèn)題，我們提出了基于多智能體協(xié)同學(xué)習(xí)實(shí)現(xiàn)了搜索多個(gè)異構(gòu)場(chǎng)景間的環(huán)境感知、場(chǎng)景通信、單獨(dú)決策和聯(lián)合學(xué)習(xí)，實(shí)現(xiàn)聯(lián)合收益***化，而不是此消彼長(zhǎng)。

經(jīng)過(guò)了“檢索時(shí)代->大規(guī)模機(jī)器學(xué)習(xí)時(shí)代->大規(guī)模實(shí)時(shí)在線學(xué)習(xí)時(shí)代->深度學(xué)習(xí)與智能決策時(shí)代”這4個(gè)歷史階段的耕耘和積累，我們逐漸形成了今天的搜索算法排序體系(如下圖)。

三、未來(lái)發(fā)展：認(rèn)知智能的探索

如上所示，經(jīng)過(guò)多年的發(fā)展，搜索和推薦作為阿里電商兩個(gè)***的自然流量入口，已經(jīng)All in AI，并形成了完整的用戶(hù)偏好在線學(xué)習(xí)，流量的精細(xì)化匹配，以及基于強(qiáng)化學(xué)習(xí)等智能決策能力的購(gòu)物決策體系。

但在這個(gè)過(guò)程中，搜索排序或者推薦學(xué)習(xí)到的知識(shí)更多都是通過(guò)已有的商品標(biāo)簽數(shù)據(jù)和用戶(hù)行為數(shù)據(jù)來(lái)獲取的，還缺少對(duì)商品和用戶(hù)更深層次的認(rèn)知，還無(wú)法完全理解用戶(hù)的多元意圖表達(dá)的真實(shí)需求。比如，用戶(hù)搜索了“性感連衣裙”，可能是想找“去參加晚場(chǎng)party的低胸晚裝裙”，也可能是想找“去海邊度假的露肩沙灘裙”;用戶(hù)收藏了“登山鞋”和“拐杖”，可能有“登山裝備”的需求，需要發(fā)現(xiàn)更多的和登山裝備相關(guān)的其它品類(lèi)商品;一個(gè)有孩子的爸爸，在暑假剛開(kāi)始時(shí)，挑選“轉(zhuǎn)換接頭”，查看“大英博物館門(mén)票”，可能是想帶著家人一起“暑期英國(guó)親子游”，需要發(fā)現(xiàn)更多相關(guān)的其它品類(lèi)商品。

究其原因，目前人工智能技術(shù)特別是以深度學(xué)習(xí)為代表的模型，在現(xiàn)實(shí)應(yīng)用中快速發(fā)展，最主要受益于海量大數(shù)據(jù)以及大規(guī)模計(jì)算能力，通過(guò)對(duì)物理世界的數(shù)字化抽象和程式化學(xué)習(xí)，使得人工智能具備很強(qiáng)的限定知識(shí)的獲取能力，而很難獲得數(shù)據(jù)之外的知識(shí)，就更不用說(shuō)知識(shí)的類(lèi)比、遷移和推理了。而機(jī)器的認(rèn)知智能，比如自主學(xué)習(xí)和發(fā)現(xiàn)，甚至創(chuàng)造能力才是人工智能的更高境界。當(dāng)然通用的人工智能還有很多工作要做，但在這個(gè)過(guò)程中，怎么樣首先結(jié)合人類(lèi)知識(shí)和機(jī)器智能做到初步的認(rèn)知智能，讓淘寶搜索和推薦擁有智慧化的體驗(yàn)是我們目前在探索的方向。

實(shí)現(xiàn)認(rèn)知智能，首先需要我們對(duì)用戶(hù)，商品，賣(mài)家等有更深入的認(rèn)知，系統(tǒng)化的建立起電商領(lǐng)域的認(rèn)知知識(shí)體系。下圖展示了我們定義的電商人-貨-場(chǎng)三維的認(rèn)知圖譜，由四部分組成，包括用戶(hù)、場(chǎng)景、類(lèi)目(淘寶類(lèi)目/虛擬類(lèi)目)和商品。這些不同類(lèi)型的概念構(gòu)建成了一個(gè)異構(gòu)圖，來(lái)實(shí)現(xiàn)用戶(hù)-場(chǎng)景-商品的關(guān)聯(lián)以及各維度數(shù)據(jù)的深刻認(rèn)知。

圖：人-貨-場(chǎng)三維組成的電商認(rèn)知圖譜示例

其中場(chǎng)景是商品關(guān)系的語(yǔ)義化描述，是用戶(hù)需求的概念化表示，是連接用戶(hù)與商品的橋梁。從商品端來(lái)看，場(chǎng)景可以理解為一種具有語(yǔ)義解釋的商品關(guān)系描述，例如同屬“中秋送禮”這一個(gè)場(chǎng)景的商品具備在中秋節(jié)作為禮物的商品屬性。從用戶(hù)端來(lái)看，場(chǎng)景可以看作是對(duì)用戶(hù)需求的概念化描述，例如“戶(hù)外燒烤”、“度假穿搭”等。因此我們也可以說(shuō)，場(chǎng)景是連接用戶(hù)與商品的橋梁。這些場(chǎng)景關(guān)系既可以是通過(guò)行為數(shù)據(jù)挖掘獲得，也可以是行業(yè)或?qū)＜抑R(shí)的輸入。場(chǎng)景，類(lèi)目與商品最終組成統(tǒng)一的場(chǎng)景圖譜。

有了這樣的認(rèn)知圖譜體系后，再通過(guò)推理計(jì)算識(shí)別用戶(hù)真實(shí)場(chǎng)景訴求，就可以逐步實(shí)現(xiàn)搜索和推薦的認(rèn)知智能化。這就涉及到認(rèn)知智能體系中另一個(gè)重要的部分：基于認(rèn)知圖譜的在線圖計(jì)算與推理引擎。有了計(jì)算和推理引擎后就可以實(shí)現(xiàn)：在用戶(hù)需求已有行為表達(dá)時(shí)，認(rèn)知用戶(hù)需求場(chǎng)景，挖掘并滿足用戶(hù)更深層的需求;在用戶(hù)需求沒(méi)有行為表達(dá)時(shí)，根據(jù)時(shí)間地點(diǎn)、用戶(hù)圖譜等信息，擴(kuò)展和激發(fā)用戶(hù)需求;同時(shí)根據(jù)線上投放數(shù)據(jù)和用戶(hù)反饋，優(yōu)化認(rèn)知圖譜的場(chǎng)景挖掘和建設(shè)，持續(xù)不斷修正和發(fā)現(xiàn)場(chǎng)景，提升推理能力。

認(rèn)知圖譜和在線圖計(jì)算與推理引擎的背后，一方面是一系列我們已經(jīng)有沉淀和積累的技術(shù)的深度應(yīng)用，包括知識(shí)表示存儲(chǔ)與推理、信息檢索、自然語(yǔ)言處理等一些傳統(tǒng)技術(shù);另一方面，認(rèn)知圖譜可以和深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)等近年來(lái)取得突破性進(jìn)展的技術(shù)進(jìn)行深度融合，例如實(shí)體和關(guān)系的向量化表示(embedding)，使得實(shí)體的檢索和關(guān)系的推理從離散走向連續(xù);認(rèn)知圖譜作為優(yōu)化約束同現(xiàn)有的深度監(jiān)督網(wǎng)絡(luò)進(jìn)行融合，將領(lǐng)域知識(shí)更加平滑的應(yīng)用到模型中，而不是簡(jiǎn)單的規(guī)則生效;知識(shí)的推理過(guò)程中引入序列決策過(guò)程建模，使用強(qiáng)化學(xué)習(xí)減少搜索空間以加速推理過(guò)程等等。

有了認(rèn)知圖譜和在線推理引擎之后，在全域的搜索推薦導(dǎo)購(gòu)、智能交互和內(nèi)容生成等各領(lǐng)域上，都會(huì)發(fā)生各種精妙的化學(xué)反應(yīng)，并且在認(rèn)知應(yīng)用過(guò)程中，根據(jù)用戶(hù)對(duì)認(rèn)知推理結(jié)果的反饋，系統(tǒng)持續(xù)迭代優(yōu)化的認(rèn)知圖譜以及推理算法，從而提升認(rèn)知計(jì)算能力。逐漸地，我們可以建設(shè)完成具備自學(xué)習(xí)能力、推理能力和驗(yàn)證能力的全方位的電商認(rèn)知智能化體系。

四、小結(jié)

搜索推薦算法多年的發(fā)展，就是圍繞著商品與人的連接以及相應(yīng)的商業(yè)訴求，從最初簡(jiǎn)單的統(tǒng)計(jì)模型，機(jī)器學(xué)習(xí)到形成完整的離線在線與實(shí)時(shí)的深度學(xué)習(xí)與智能決策體系，不斷突破自我，讓連接匹配的質(zhì)量更高，連接的廣度更寬，同時(shí)通過(guò)機(jī)制設(shè)計(jì)促進(jìn)整個(gè)商業(yè)和生態(tài)的健康發(fā)展，成為整個(gè)新商業(yè)發(fā)展的引擎驅(qū)動(dòng)。站在今天總結(jié)過(guò)去的算法演進(jìn)，看未來(lái)電商搜索推薦算法的發(fā)展，期待從機(jī)器智能到如何結(jié)合機(jī)器智能與人類(lèi)智能做到真正的認(rèn)知智能實(shí)現(xiàn)搜索推薦新的交互和新的體驗(yàn)。

作者簡(jiǎn)介：青峰，搜索推薦算法技術(shù)負(fù)責(zé)人，阿里巴巴研究員

【本文為51CTO專(zhuān)欄作者“阿里巴巴官方技術(shù)”原創(chuàng)稿件，轉(zhuǎn)載請(qǐng)聯(lián)系原作者】

戳這里，看該作者更多好文

責(zé)任編輯：武曉燕來(lái)源： 51CTO專(zhuān)欄

電商搜索算法

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開(kāi)發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)

<bdo id="apkys"></bdo>