偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

一淘公達(dá):解決個性化搜索中的時效性與數(shù)據(jù)碎片化

原創(chuàng)
開發(fā) 項目管理
在2013年阿里巴巴集團(tuán)主辦的ADC&#8226;阿里技術(shù)嘉年華,這是一場專屬于<互聯(lián)網(wǎng)工程師>的“技術(shù)盛宴”,倡導(dǎo)<干貨分享>的大會上,51CTO記者有幸采訪到了一淘的個性化搜索專家 陳曦(公達(dá))老師,主要針對目前個性化搜索中面臨的一些重要的問題采訪,比如SEO與個性化之間的問題,防止過度個性化,以及在個性化中的時效性與數(shù)據(jù)碎片化對個性化搜索的影響。

搜索引擎誕生到現(xiàn)在已經(jīng)有幾十年歷史,期間搜索技術(shù)一直在不斷的變化,從最初的目錄索引到關(guān)鍵詞,以及目前正在發(fā)展階段的語音搜索、圖片搜索等等,搜索引擎在不斷進(jìn)化當(dāng)中。如果現(xiàn)在來談?wù)勊阉饕娴南乱粋€趨勢是什么,那么個性化搜索引擎無疑是最受關(guān)注的方向,并且將成為搜索引擎的未來。因為,當(dāng)前的搜索引擎盡管還能給用戶提供一些有用的東西,但是因不同地區(qū)、個人興趣習(xí)慣、社交關(guān)系等因素去搜索時,得到的搜索結(jié)果卻不盡人意,這是目前搜索引擎需要改進(jìn)的地方。

在阿里巴巴集團(tuán)今年主辦的ADC•阿里技術(shù)嘉年華這一場專屬于<互聯(lián)網(wǎng)工程師>的“技術(shù)盛宴”,倡導(dǎo)<干貨分享>的大會上,51CTO記者有幸采訪到了一淘的個性化搜索專家 陳曦(公達(dá))老師,主要針對目前個性化搜索中面臨的一些重要的問題采訪,比如SEO與個性化之間的問題,防止過度個性化,以及在個性化搜索中的時效性與數(shù)據(jù)碎片化對個性化搜索的影響。

 

下面是采訪實(shí)錄:

記者:個性化搜索這門技術(shù)是怎么起源的?它最新的進(jìn)展是什么樣的情況?

公達(dá):最早做個性化的應(yīng)該是谷歌,像他們這些通用的搜索引擎,到現(xiàn)在阿里也開始做個性化,而他們做的效果都不是特別滿意。因為到目前為止沒有看到特別好的個性化搜索的產(chǎn)品,我們淘寶做這個個性化搜索,其實(shí)有一些自己的優(yōu)勢。因為我們有更加忠實(shí)的用戶,有更豐富的數(shù)據(jù),所以我們應(yīng)該可以達(dá)到更好的個性化的效果。我們也是最近這么一兩年來才開始做個性化的搜索。

記者:那就是說阿里在投入個性化搜索也就是最近一兩年的事。到現(xiàn)在為止取得了怎么樣的成績?你們是怎么判斷自己的成績?怎么去衡量自己的成果?有沒有覺得不滿意?

公達(dá):我們自己肯定是在個性化有自己的一些理解,比如說我們希望個性化搜索能達(dá)到什么樣的效果,我們實(shí)現(xiàn)的時候,我們肯定會先按照我們希望的效果來做,等做出來了一個初步的效果之后,我們會讓用戶來通過實(shí)際的一些用戶來給我們評價,到底我們的效果是不是他們滿意的,我們是通過這樣來評價的。

記者:在個性化搜索系統(tǒng)中,它的難點(diǎn)在于什么地方?它是技術(shù)難點(diǎn)還是產(chǎn)品難點(diǎn)?

公達(dá):它應(yīng)該是兩方面難點(diǎn)都有的,比如說技術(shù)上面的話,最困難的是說我們怎么樣能夠把用戶的個性化、個性信息描述準(zhǔn)確。比如他的性別,或者是他喜歡的衣服的風(fēng)格等等,我們怎么樣能夠給他預(yù)測準(zhǔn)。第二個是預(yù)測準(zhǔn)了之后,他到底是不是喜歡?這個其實(shí)也是因為不同的人,他對自己一些購物的特點(diǎn)都是不太一樣,有的人雖然以前喜歡某個東西,但是突然他的信息又變化了。這種興趣的不確定性,這是最困難的一個地方。

從產(chǎn)品上面來講,其實(shí)也就是這個用戶到底能不能夠更加適用個性化需求的結(jié)果,他會不會覺得我們預(yù)測錯了,或者怎么樣的話,可能以后就不太會再用了。我們希望能夠盡量預(yù)測準(zhǔn),那樣他才會一直用下去。

記者:個性化搜索技術(shù),在一個典型的個性化搜索團(tuán)隊里面,大家都是什么樣的人員構(gòu)成,都有哪些職責(zé)分工?

公達(dá):首先我們有很多人是在做那些基礎(chǔ)的數(shù)據(jù),比如說可能會計算用戶的各種偏好,這是屬于很基礎(chǔ)的數(shù)據(jù)。我們目前會有一個很大的團(tuán)隊來做這件事情。包括用戶的各種數(shù)據(jù),像他的年齡、性別,包括他的職業(yè),一些購物的興趣點(diǎn)之類的事情,我們都有一個比較大的團(tuán)隊來計算。第二個,我們會有系統(tǒng)方面的一些工作,比如說我們要搭建一個個性化的搜索的系統(tǒng),我們有實(shí)時的個性化系統(tǒng),我們搜索引擎也會支持更多個性化。第三部分,算法方面需要利用用戶的一些個性化信息,然后給他推出一個合適的搜索結(jié)果。其實(shí)就是數(shù)字與系統(tǒng)和算法這三部分,是我們個性化主要的部分。

記者:剛才你談到會有很大一個團(tuán)隊專門在做數(shù)據(jù)的搜集整理,對于個性化推薦來講會不會有很多用戶覺得侵犯到他們的隱私,你們是怎么看待這個問題?

公達(dá):目前的話,我們倒是沒有收到明顯的用戶投訴說我們收集到了他的隱私,其實(shí)不太正常的。因為用戶的行為在淘寶上有紀(jì)錄應(yīng)該是一個很正常的,大家都可以認(rèn)可的事情。比如說你買了什么樣的東西,這個肯定是需要有紀(jì)錄的,而且自己也能查看的,當(dāng)然淘寶肯定是有數(shù)據(jù)。如果說用戶實(shí)在是不想我們收集的話,我們以后也會提供這樣的一個功能,我們可以不對他做個性化或者怎么樣,都是可以。

記者:在現(xiàn)在的互聯(lián)網(wǎng)企業(yè),在什么時候才能需要到一個個性化搜索?

公達(dá):那肯定是它的一個通用的搜索,如果說已經(jīng)做的比較成熟了。對用戶的數(shù)據(jù)也搜集的足夠多了,如果說他有一個比較穩(wěn)定的客戶群,這個時候他可以考慮給他一些穩(wěn)定的客戶,給他們一些定制的個性化的結(jié)果。

記者:在實(shí)時計算和離線計算對于個性化搜索哪個占的優(yōu)勢比較多一些?你們應(yīng)用比較多的是哪一個?

公達(dá):這個應(yīng)該兩方面都是占的比較多的,因為離線計算的話,它是對于那種長期的偏好是比較重要的,實(shí)時計算的話對于當(dāng)前用戶的時時的偏好是非常重要的。這方面目前在規(guī)劃里面都是很重要的兩個方面。

記者:個性化搜索有一個行為叫做時效性,我聽你在演講過程當(dāng)中也有講過這個問題,你們是怎么去處理這個問題?

公達(dá):我們首先是用戶默認(rèn)的,或者一個長期的偏好的模式,比如說三個月或者六個月的興趣來算的,他實(shí)時計算當(dāng)天的行為就是會放到時時的數(shù)據(jù)里面。這個實(shí)時的數(shù)據(jù),當(dāng)它達(dá)到了一定的精確度之后,就會來修改他長期的偏好,所以它應(yīng)該是一個互相結(jié)合的過程。

記者:你們怎么去排除一些過期的行為?比如說比較久的?這些可能在用戶當(dāng)中已經(jīng)并不存在了,或者他們那些行為在過程當(dāng)中也會改變的等等?

公達(dá):比較久了,那就是從長期模型里面找。長期模型里面我們肯定會考慮所謂的時間,越近的行為肯定是越重要的,越遠(yuǎn)的行為越不重要。所以既然發(fā)生的時間很久了,那么它的重要性就降低了,這樣也會被新的行為所取代了。

記者:你們一般做這塊的話,都是以最新的一些行為作為標(biāo)準(zhǔn),他以前的一般就不會考慮。

公達(dá):如果他最近的行為已經(jīng)足夠豐富了,那么他以前的行為肯定不重要了。但如果他最近沒有什么行為,那他很久以前的行為也是有一定的好處的。

#p#

記者:在個性化搜索當(dāng)中,個性化定制的功能在一淘中用戶體現(xiàn)的是怎么樣的?有沒有好的反饋?

公達(dá):個性化定制,目前用戶還是比較多的,因為已經(jīng)上線了一段時間了,當(dāng)然用的人還是比較多的。這些用的人他會通過這個性化定制可以修改他們個性化的信息。

記者:個性化搜索,它有數(shù)據(jù)挖掘技術(shù)在里面,而對于數(shù)據(jù)的來源要求還是挺高的。在這一塊,對于數(shù)據(jù)的碎片化,你怎么去解決這個問題?

公達(dá):碎片化其實(shí)就是說這個數(shù)據(jù)很稀疏,我們是盡量豐富數(shù)據(jù)的,比如說我們可以用三個月或者六個月,或者一年的數(shù)據(jù),用的數(shù)據(jù)越多,肯定它的吸收性能也就越好了。我們會用一類人的一些數(shù)據(jù),比如說對于用戶來說,我們是給他分一些群體,而不是說每個用戶都是不一樣,然后再保密。我們會給他一些比較寬泛的定義,比如說像價格檔位,我們也可以分五檔,并不是說分十檔,或者二十檔,那可能太稀釋了。

記者:很多時候大家討論個性化搜索對于一個網(wǎng)站的SEO其實(shí)是有一些影響的,你怎么看待這個問題?就目前大部分的網(wǎng)站做SEO主要是排名的競爭,很少會用到個性化搜索,你怎么看這個問題?

公達(dá):個性化搜索的話,其實(shí)是要求他,每一個賣家能夠給它提出了更高的要求。就是說它需要服務(wù)好每一類人,如果說以前的話他服務(wù)好大眾的人就行了。但是現(xiàn)在如果他想拿到更多的流量,他就需要對每一類人都服務(wù)的好,這樣他在每一類人的排序上面,可能都會比較前面。所以對于個性格搜索 來說,需要考慮的更多了一點(diǎn)。

記者:在淘寶上,我看到很多賣家,在關(guān)鍵詞上面,他做了很多SEO優(yōu)化,這上面什么關(guān)鍵詞都有。對于個性化搜索來說,它有沒有能夠精準(zhǔn)的定位,賣家有沒有什么影響?我是說在搜很多東西的時候,賣家的關(guān)鍵詞幾乎什么都覆蓋掉了,對個性化搜索有什么影響?

公達(dá):如果說體現(xiàn)的關(guān)鍵詞太多,如果說太多的話,而且是一個不正當(dāng)?shù)?,甚至和寶貝并不符合的關(guān)鍵詞,那可能本身被排起來,他是不利的。因為我們對這種亂填的關(guān)鍵詞會有一定的處罰,如果都是正常地描述一個寶貝的關(guān)鍵詞,那肯定是不會有太大影響。即使是個性化也是都會考慮的。

記者:你目前在做這一塊的話,能講一些目前的難點(diǎn)嗎?就是比較困難的地方。

公達(dá):困難的地方,我們怎么樣能夠把用戶的興趣描述的更準(zhǔn)了。比如說他的購買力、他的性別等等,就是說越準(zhǔn)確的話,用戶的體驗就會越好。如果給他預(yù)測錯的話,他的體驗就不是很好。甚至是或者會修改,或者會關(guān)閉個性化。如果說越準(zhǔn)確的話,他肯定是越喜歡用。所以我們會讓用戶的體驗更加地好。

記者:在目前的移動互聯(lián)網(wǎng)發(fā)展這么快,在移動端,用戶對搜索的需求還是挺高的。一般他想定位一個產(chǎn)品,搜索一個產(chǎn)品的話,他兩到三步就能夠精準(zhǔn)地定位到這個內(nèi)容。一淘的移動端在這方面做的如何?

公達(dá):移動端的話,目前肯定會考慮。比如說手機(jī)的類型是iPhone還是Android之類的,或者也會考慮其他的地方。這些信息的話,肯定是一個個性化的重要信息。但是在移動上面具體有什么樣的特點(diǎn)?這肯定也是通過模型計算出來的。因為移動上面我們也會有移動方面?zhèn)€性化的模型,上面可能會體現(xiàn)出移動上面不同的特點(diǎn)來。

記者:在個性化搜索,目前你認(rèn)為它對一個傳統(tǒng)搜索,是不是一個發(fā)展的趨勢?未來能不能代替?zhèn)鹘y(tǒng)搜索?

公達(dá):至少從電子商務(wù)這個方面來說,我覺得個性化還是很重要,未來肯定是會越做越多的。因為我們最終的理想肯定是讓每一個用戶都能達(dá)到最好的體驗,肯定是對每個用戶的個性,如果說都能夠滿足的好,肯定他的體驗是最好的。

 

責(zé)任編輯:林師授 來源: 51CTO.com
相關(guān)推薦

2013-07-13 14:11:11

個性化搜索

2020-06-28 07:00:00

推薦系統(tǒng)智能商務(wù)服務(wù)平臺

2023-03-21 12:46:30

智慧城市人工智能大數(shù)據(jù)

2022-11-01 07:19:45

推薦系統(tǒng)非個性化

2016-09-29 12:09:47

大數(shù)據(jù)搜索個性化服務(wù)

2011-08-18 18:53:30

win7

2022-09-06 17:43:02

??AISummit數(shù)據(jù)運(yùn)營

2015-07-17 07:39:44

搜索下拉框產(chǎn)

2013-01-07 11:18:20

2015-11-09 10:12:08

大數(shù)據(jù)個性化推薦

2023-07-12 12:02:06

WOT大數(shù)據(jù)流式數(shù)據(jù)湖

2011-01-20 10:19:21

PowerShell個性化

2023-12-20 13:50:00

SpringBootJSON序列化

2009-07-13 15:33:24

桌面虛擬化虛擬化IT

2014-06-03 17:11:39

FM數(shù)據(jù)挖掘數(shù)據(jù)處理

2017-07-13 10:52:36

個性化系統(tǒng)商業(yè)化

2011-05-04 14:38:53

海爾江山帝景一體機(jī)

2013-11-07 16:42:34

Windows 8.1個性化

2009-02-20 14:31:25

谷歌李開復(fù)整合搜索

2021-10-19 08:00:00

Windows 11Windows微軟
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號