偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

國(guó)美深度學(xué)習(xí)初體驗(yàn),開啟社交電商的智能時(shí)代!

原創(chuàng)
人工智能 深度學(xué)習(xí)
相對(duì)于機(jī)器學(xué)習(xí)和深度學(xué)習(xí),人工智能的概念更為寬泛。在機(jī)器學(xué)習(xí)方法興起之前,大部分的人工智能應(yīng)用都是基于邏輯推理實(shí)現(xiàn),即設(shè)定N多規(guī)則,在不同場(chǎng)景,讓機(jī)器或者程序做選擇。

 [[197317]]

【51CTO.com原創(chuàng)稿件】本周五(2017 年 7 月 21 日),由 51CTO 主辦的 WOTI2017 全球創(chuàng)新技術(shù)峰會(huì)將于北京富力萬麗酒店舉行,此次峰會(huì)設(shè)有全天的***論壇,及深度學(xué)習(xí)、人機(jī)交互和智+應(yīng)用等分論壇。

國(guó)美大數(shù)據(jù)中心副總監(jiān)楊驥,將出席深度學(xué)習(xí)分論壇,做主題為“深度學(xué)習(xí)開啟社交電商智能時(shí)代”的演講。在會(huì)前交流中,楊驥介紹了此次演講的部分技術(shù)干貨,讓我們搶先看。

人工智能、機(jī)器學(xué)習(xí)與深度學(xué)習(xí)的關(guān)系

從馮諾依曼體系結(jié)構(gòu)的提出開始,人類使用計(jì)算機(jī)就有了智能化的訴求。也就是使用計(jì)算機(jī)或機(jī)器人能夠幫助人類做繁雜或者做不到的事情,從根本上來說,就是提升整個(gè)社會(huì)的生產(chǎn)效率。

相對(duì)于機(jī)器學(xué)習(xí)和深度學(xué)習(xí),人工智能的概念更為寬泛。在機(jī)器學(xué)習(xí)方法興起之前,大部分的人工智能應(yīng)用都是基于邏輯推理實(shí)現(xiàn),即設(shè)定N多規(guī)則,在不同場(chǎng)景,讓機(jī)器或者程序做選擇。

作為人工智能的一個(gè)分支,機(jī)器學(xué)習(xí)利用統(tǒng)計(jì)或者幾何表達(dá)的形式處理問題,專門研究計(jì)算機(jī)怎樣模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為,以獲取新的知識(shí)和技能。直到上世紀(jì)90年代,伴隨著互聯(lián)網(wǎng)行業(yè)的興起,機(jī)器學(xué)習(xí)掀起了人工智能領(lǐng)域一個(gè)新的熱潮。

深度學(xué)習(xí)屬于神經(jīng)網(wǎng)絡(luò)模型的范疇,本身并不是一個(gè)新的概念,早在上世紀(jì)四、五十年代,就有了最簡(jiǎn)單的神經(jīng)網(wǎng)絡(luò)——感知機(jī)模型。

2006 年,Geoffrey Hinton 提出了 LayerwisePre-Training 方法訓(xùn)練多層 RBM 網(wǎng)絡(luò)(即 DBN),神經(jīng)網(wǎng)絡(luò)在大數(shù)據(jù)規(guī)模上的效果取得了長(zhǎng)足的進(jìn)展。

深度學(xué)習(xí)本身就是對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行分層表達(dá),將低層級(jí)特征逐步抽象成高層級(jí)特征的過程,同時(shí)擬合出非常復(fù)雜的高維非線性函數(shù),這是大多數(shù)機(jī)器學(xué)習(xí)模型難以望其項(xiàng)背的。

機(jī)器學(xué)習(xí)在國(guó)美的應(yīng)用實(shí)踐

目前機(jī)器學(xué)習(xí)在國(guó)美的應(yīng)用,常規(guī)階段已經(jīng)趨近成熟,如基礎(chǔ)數(shù)據(jù)收集、數(shù)據(jù)處理、特征工程、模型部署等方面,目前的主要工作是算法和業(yè)務(wù)邏輯的快速迭代。

接下來我們會(huì)在深度學(xué)習(xí)、計(jì)算機(jī)視覺、自然語言處理、語音識(shí)別等方面繼續(xù)加大研發(fā)力度,除了搜索、推薦、廣告等線上業(yè)務(wù)外,還會(huì)重點(diǎn)支持線下門店的新興購物場(chǎng)景,實(shí)現(xiàn)國(guó)美社交電商的新零售平臺(tái)落地。

我入職時(shí),國(guó)美在機(jī)器學(xué)習(xí)方面還比較薄弱,之后團(tuán)隊(duì)建設(shè)、整套算法和架構(gòu)部署等都由我親自建設(shè)起來。相比之前的效果,GMV 提升幅度非常大。舉例來說,在商品推薦過程中,利用機(jī)器學(xué)習(xí)排序和傳統(tǒng)的排序方式相比,各方面都有很大改變。

初期針對(duì) Web 首頁、手機(jī) APP 首頁等一些推薦位置,系統(tǒng)基于冷啟數(shù)據(jù),做一些歸類、統(tǒng)計(jì)等,展示到頁面上,這時(shí)每個(gè)用戶訪問的時(shí)候,看到的效果毫無差別。

這樣就會(huì)使得用戶對(duì)推薦產(chǎn)品不感興趣,毫無粘性可言,同時(shí)將其他商品寶貴的曝光機(jī)會(huì)浪費(fèi)掉了。那么如何做到推薦個(gè)性化?這里就涉及到利用機(jī)器學(xué)習(xí)進(jìn)行推薦的個(gè)性化排序。

如下圖,是機(jī)器學(xué)習(xí)排序工作流:

先要對(duì)海量的數(shù)據(jù)進(jìn)行訓(xùn)練,基于用戶、查詢、商家數(shù)據(jù)找特征,之后做模型訓(xùn)練,經(jīng)過線上部署之后,正式上線。

如下圖,是推薦排序的訓(xùn)練流程:

推薦排序訓(xùn)練流程分別為場(chǎng)景恢復(fù)、訓(xùn)練樣本構(gòu)建、模型訓(xùn)練和線上實(shí)驗(yàn)這四部分。

推薦離線模型的構(gòu)建流程:

  • 收集用戶行為,包括點(diǎn)擊、加購、關(guān)注、下單等。
  • 對(duì)行為進(jìn)行過濾,比如:join(白名單)、統(tǒng)計(jì)截?cái)?、position-bias、多次加/刪購等處理。
  • 制定行為評(píng)分規(guī)則,生成評(píng)分矩陣。
  • 訓(xùn)練矩陣分解模型。
  • 導(dǎo)入緩存,請(qǐng)輸入文案。

如下圖,是推薦離線模型的評(píng)分規(guī)則:

這里值得提醒的是在打分之前,必須要對(duì)數(shù)據(jù)進(jìn)行清洗,去除“點(diǎn)擊狂人”、“用戶誤點(diǎn)”、“買后查單”等情況。其中,對(duì)非常活躍的用戶要對(duì)他的行為進(jìn)行降采樣。

深度學(xué)習(xí)在國(guó)美的應(yīng)用實(shí)踐

傳統(tǒng)計(jì)算機(jī)視覺工作流是由計(jì)算機(jī)視覺專家進(jìn)行特征的設(shè)計(jì),如 SIFT,KAZE,HoG,SURF 等。之后是訓(xùn)練分類器,進(jìn)行多目標(biāo)識(shí)別。

如下圖,是傳統(tǒng)計(jì)算機(jī)視覺工作流程:

 

傳統(tǒng)計(jì)算機(jī)視覺領(lǐng)域不僅需要領(lǐng)域知識(shí),還需要耗費(fèi)巨量時(shí)間,深度學(xué)習(xí)的發(fā)展給這個(gè)領(lǐng)域帶來了新的變革。

深度學(xué)習(xí)工作流是根據(jù)訓(xùn)練數(shù)據(jù)自動(dòng)構(gòu)建特征,將特征抽取和分類/檢測(cè)任務(wù)同時(shí)進(jìn)行。深度學(xué)習(xí)專家需要做的事情就是定義神經(jīng)網(wǎng)絡(luò)架構(gòu),并進(jìn)行訓(xùn)練。

如下圖,是深度學(xué)習(xí)工作流:

深度學(xué)習(xí)會(huì)自動(dòng)訓(xùn)練出好的特征,并且很多方法可以在各個(gè)領(lǐng)域中通用。在國(guó)美的做法是深度學(xué)習(xí)+CV 工作流,也就是將計(jì)算機(jī)視覺特征和深度學(xué)習(xí)特征相結(jié)合。

同時(shí),抽取計(jì)算機(jī)視覺特征和 DNN 特征,之后進(jìn)行多目標(biāo)的識(shí)別。如下圖:

深度學(xué)習(xí)與視覺特征

利用機(jī)器學(xué)習(xí)對(duì)圖像視覺特征進(jìn)行提取的過程,可以分為四步,分別是圖像標(biāo)注、提取特征、降維和匹配檢索

圖像標(biāo)注。對(duì)國(guó)美全站的商品圖像進(jìn)行標(biāo)注,這個(gè)過程中最主要的工作是數(shù)據(jù)清洗,即把不能和品類對(duì)應(yīng)的圖片刪除或者重新進(jìn)行品類校準(zhǔn)。

先統(tǒng)計(jì)國(guó)美全站最近一年內(nèi)各品類下商品總數(shù)的分布,然后按照分布進(jìn)行圖片抽樣。

提取特征。圖片的特征分為通過深度學(xué)習(xí)得到的特征和圖像局部的特征??衫?caffe 訓(xùn)練 CNN。

將倒數(shù)第二層輸出作為 Feature Learning 的結(jié)果提取出來(Deep Learning + Transfer Learning),可利用局部特征算子(SIFT,kaze等)提取出圖像的局部特征。

降維。用積量化(ProductQuantization)的方法對(duì)深度學(xué)習(xí)得到的特征進(jìn)行降維,用 Fisher Vector 對(duì)圖像局部特征進(jìn)行降維。

匹配檢索。采用最近鄰搜索的方法找出每一個(gè)商品的相似商品集合。

深度學(xué)習(xí)構(gòu)建 GomePlus 新場(chǎng)景:“拍照購”

基于深度學(xué)習(xí)構(gòu)建的“拍照購”場(chǎng)景在國(guó)美已經(jīng)上線,它可以實(shí)現(xiàn)根據(jù)用戶上傳的圖片預(yù)測(cè)品類,推薦相關(guān)商品。具體步驟如下圖:

當(dāng)用戶拍照或者從 PC 和手機(jī)選取商品圖片上傳成功以后,系統(tǒng)就會(huì)進(jìn)行特征向量的計(jì)算及匹配。之后猜測(cè)用戶想要的商品,根據(jù)商品圖片庫的相關(guān)結(jié)果進(jìn)行展示。

深度學(xué)習(xí)構(gòu)建 GomePlus 新場(chǎng)景:搭配購?fù)扑]

基于深度學(xué)習(xí)的檢索技術(shù)可以得到一套通用的商品特征學(xué)習(xí)框架。

在此基礎(chǔ)上,針對(duì)不同種類商品,尤其是服裝類商品,可以進(jìn)行搭配推薦。同時(shí)有待進(jìn)一步研究分布式檢索引擎、特征壓縮、CNN 模型移動(dòng)端部署等。

深度學(xué)習(xí)構(gòu)建 GomePlus 新場(chǎng)景:相似推薦

進(jìn)行拍照購的同時(shí),我們還在個(gè)性化推薦場(chǎng)景下嘗試了基于圖片的相似推薦,因?yàn)槟壳爸髁鞯耐扑]召回方法都是在大規(guī)模用戶協(xié)同行為數(shù)據(jù)上進(jìn)行建模,會(huì)造成召回結(jié)果比較集中的問題。

從用戶的角度,相似推薦的場(chǎng)景訴求還是想找到和主商品“相貌相同或者相似”的商品。因此利用圖像找相似更符合用戶的需求,同時(shí)還提高了推薦結(jié)果的多樣性和新穎性。

寫在***

利用機(jī)器學(xué)習(xí)和深度學(xué)習(xí)構(gòu)建推薦場(chǎng)景時(shí),***的難點(diǎn)是數(shù)據(jù)源頭,即數(shù)據(jù)收集問題?,F(xiàn)在,大多數(shù)企業(yè)做算法,基本是如何做特征、如何訓(xùn)練模型。

正確的做法應(yīng)該是從數(shù)據(jù)收集、前端進(jìn)行埋點(diǎn),數(shù)據(jù)科學(xué)部門就應(yīng)該參與,而不是被動(dòng)的等待數(shù)據(jù)進(jìn)來,基于提供的數(shù)據(jù)做事情,這是非常關(guān)鍵的點(diǎn)。

未來國(guó)美在前沿技術(shù)方面的布局著重在計(jì)算機(jī)視覺和語言識(shí)別兩大方向,如線下店鋪的人臉識(shí)別、商品識(shí)別、深度學(xué)習(xí)的云平臺(tái)、智能輔助購物等。同時(shí),國(guó)美還將在圖片描述生成、圖像 2D 轉(zhuǎn) 3D、以及深度學(xué)習(xí)個(gè)性化排序等方面進(jìn)行嘗試。

作者:王雪燕

技術(shù)編輯:王雪燕,關(guān)注架構(gòu)、算法,運(yùn)維等技術(shù)領(lǐng)域,有投稿、尋求報(bào)道意向技術(shù)人請(qǐng)聯(lián)絡(luò) wangxy@51cto.com

[[197323]]

楊驥

國(guó)美互聯(lián)網(wǎng)大數(shù)據(jù)中心副總監(jiān)

負(fù)責(zé)個(gè)性化搜索和推薦平臺(tái)規(guī)劃及搭建。畢業(yè)于中國(guó)傳媒大學(xué),獲得機(jī)器學(xué)習(xí)和計(jì)算機(jī)視覺方向博士學(xué)位。先后任職于凡客、京東。多年來致力于機(jī)器學(xué)習(xí)在互聯(lián)網(wǎng)領(lǐng)域的應(yīng)用。在搜索、推薦、用戶畫像、圖像分析等方面有著豐富的實(shí)戰(zhàn)經(jīng)驗(yàn)和項(xiàng)目管理心得。目前專注于社交電商領(lǐng)域的深度學(xué)習(xí)技術(shù)。

【51CTO原創(chuàng)稿件,合作站點(diǎn)轉(zhuǎn)載請(qǐng)注明原文作者和出處為51CTO.com】

責(zé)任編輯:武曉燕 來源: 51CTO技術(shù)棧
相關(guān)推薦

2015-12-25 14:23:17

IDC年度評(píng)選

2013-04-07 15:48:15

2021-08-17 06:48:28

社交電商拼購

2014-10-31 13:54:32

2018-08-16 18:45:00

百度

2024-09-24 13:06:16

數(shù)據(jù)飛輪技術(shù)

2014-11-12 11:32:42

電商

2009-08-01 09:06:35

UbuntuOneLinux開源操作系統(tǒng)

2009-03-09 15:12:39

XenServer安裝

2014-04-21 11:13:41

銷售易CRM

2015-05-27 16:42:44

湖南經(jīng)濟(jì)新聞網(wǎng)

2012-10-09 09:45:43

數(shù)據(jù)庫實(shí)時(shí)大數(shù)據(jù)云計(jì)算

2020-05-27 15:55:07

智能城市物聯(lián)網(wǎng)技術(shù)

2017-09-15 09:07:00

國(guó)美電商零售

2017-07-26 10:40:51

云平臺(tái)

2018-09-13 10:48:04

思科智能辦公

2014-02-23 18:29:18

虛擬運(yùn)營(yíng)商

2013-08-09 09:18:25

阿里余額寶阿里云

2023-07-15 08:01:38

2013-04-07 15:51:35

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)