偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

淘寶車品覺(jué):數(shù)據(jù),你準(zhǔn)備好了沒(méi)有?

大數(shù)據(jù)
4月11日杭州舉辦的“淘寶開(kāi)放日”活動(dòng)中,阿里集團(tuán)數(shù)據(jù)委員會(huì)會(huì)長(zhǎng)車品覺(jué)在論壇上分享了其在大數(shù)據(jù)領(lǐng)域的從業(yè)經(jīng)驗(yàn)。

車品覺(jué)在加盟阿里集團(tuán)前曾在匯豐銀行、電信盈科、微軟、eBay等多家MNC擔(dān)任總監(jiān)職務(wù),積累大量中小企業(yè)在互聯(lián)網(wǎng)發(fā)展的經(jīng)驗(yàn),論壇上討論的主題為《數(shù)據(jù),你準(zhǔn)備好了沒(méi)有?》。

分享主題有十點(diǎn),我們節(jié)選了部分的主要內(nèi)容:

一切從問(wèn)題開(kāi)始

[[70498]]

提到數(shù)據(jù)中表現(xiàn)明智,不是要增加更多東西,而是要去除過(guò)份復(fù)雜和裝飾性的東西。理解了問(wèn)題 ,就能化解問(wèn)題,問(wèn)題本身就是答案。

車品覺(jué)列舉一個(gè)親身經(jīng)歷:有不少做電商的從業(yè)者向其提出疑問(wèn),B2C企業(yè)里大數(shù)據(jù)使用幾年了,真的有效么?車會(huì)反問(wèn)道,你知道你的老板在過(guò)去六個(gè)月里的困難是什么?分析師往往5-10分鐘都無(wú)法回答,這表明從業(yè)者自己都不了解應(yīng)該把數(shù)據(jù)用在哪里,這樣如何能使用好數(shù)據(jù)?。“懂問(wèn)問(wèn)題的本身,便找到了答案。”

如果分析師能把問(wèn)題拆分成三個(gè)問(wèn)題:公司現(xiàn)面對(duì)的頭三個(gè)問(wèn)題是什么?未來(lái)三個(gè)月要解決的是什么?過(guò)去一個(gè)月作對(duì)了什么?事情便好辦多了。車再次舉出了一個(gè)在面試中自己常問(wèn)的問(wèn)題:“今天早上九點(diǎn),我是淘寶的CEO,你是我的分析師,請(qǐng)給我三個(gè)指標(biāo),讓我對(duì)上周的業(yè)績(jī)安心。”

面試者常常不假思索的回答:“流量”,“交易量”,碰到第三個(gè)問(wèn)題,才需要思考。這表明面試者并不了解問(wèn)題:?jiǎn)栴}的核心在于對(duì)象是淘寶,不是所有的電商,目標(biāo)是CEO,而不是產(chǎn)品總監(jiān),第三問(wèn)題表明這是一個(gè)周敏感的數(shù)據(jù)(參考答案會(huì)在后文解答)。

“數(shù)據(jù)的力度是無(wú)窮的,你可以在不同維度里一直拆分下去,分析師只需要知道哪些數(shù)據(jù)對(duì)自己有用即可。”而數(shù)據(jù)收集的難度在于,你的起步應(yīng)該有多寬,如何預(yù)判哪些數(shù)據(jù)是可以為將來(lái)所用,這個(gè)問(wèn)題困難了車半年的時(shí)間。

在實(shí)踐中提煉數(shù)據(jù)的敏捷性

big-data

在動(dòng)態(tài)中試驗(yàn),找出數(shù)據(jù)的規(guī)律性規(guī)律性就是不僅我會(huì)用,只要你知道了,你也會(huì)用。數(shù)據(jù)必須不停的時(shí)候,若僅憑借記錄的數(shù)據(jù),是難以還原當(dāng)時(shí)的場(chǎng)景:有一個(gè)人在下雨天買了面包,如果不再當(dāng)時(shí)去考慮,是無(wú)法推斷出影響此行為的決定性因素。背景數(shù)據(jù)無(wú)法還原當(dāng)時(shí)情況。

航海日志是一個(gè)很好的例子,收集數(shù)據(jù)后定位——進(jìn)而做出決策——發(fā)現(xiàn)差異——回饋從新定位收集數(shù)據(jù)的范圍。這個(gè)過(guò)程中需要不斷的反饋,最后做成一個(gè)表格,數(shù)據(jù)便是這么提煉出來(lái)。

讓數(shù)據(jù)——獲取、使用、分享、協(xié)同、連接、組合

由于現(xiàn)在的數(shù)據(jù)統(tǒng)計(jì)得極不規(guī)范,使用數(shù)據(jù)的人很難有效的獲取信息,讓用戶輕松感受到數(shù)據(jù)的價(jià)值,過(guò)去在做數(shù)據(jù)時(shí),很少會(huì)有人考慮用戶體驗(yàn),這恰恰是最重要的。比如數(shù)據(jù)里面出現(xiàn)了SQL,便使得很多技術(shù)以外人士無(wú)法讀懂,美國(guó)現(xiàn)在已經(jīng)有企業(yè)提倡去除SQL,便是為了減低交流成本。

上面說(shuō)的是使用。如何獲取同樣也是十分重要的問(wèn)題。Google Glass這款產(chǎn)品為何如此重要?因?yàn)樗苁占臄?shù)據(jù)與傳統(tǒng)渠道的區(qū)隔是天翻地覆的:從一個(gè)人早上起來(lái)遇到的每一個(gè)場(chǎng)景、每一個(gè)回饋所得的數(shù)據(jù)都收集起來(lái),一個(gè)人50%-60%的數(shù)據(jù)都能收集到。讓數(shù)據(jù)盡可能簡(jiǎn)單的收集起來(lái)。

顛覆創(chuàng)新來(lái)自分裂或重組

一個(gè)人注冊(cè)網(wǎng)站的時(shí)候,可能性別會(huì)是男。但仔細(xì)調(diào)查可以發(fā)現(xiàn),或許早上的性別是男,晚上是女?;蛘?0%是男,30%是女。過(guò)去是0與1的關(guān)系,現(xiàn)在是0-1的關(guān)系,這是一個(gè)立體的數(shù)據(jù),年齡也是同樣的情況。

車品覺(jué)在這里舉了一個(gè)鮮活的例子:“現(xiàn)購(gòu)物人群趨勢(shì)里,出現(xiàn)了diaos高帥富化與高帥富diaos化,三四十歲的人群,去買顏色很鮮艷的手機(jī);而工薪族會(huì)去以數(shù)個(gè)月的工資來(lái)買一個(gè)LV包,這些都是很常見(jiàn)的。”分析的時(shí)候需要具體進(jìn)行分裂。

4

以假設(shè)數(shù)據(jù)都能獲取去思考問(wèn)題

大數(shù)據(jù)是眾多事物的數(shù)據(jù)化,獲取數(shù)據(jù)的成本越來(lái)越低。阿里數(shù)據(jù)科學(xué)部的楊滔先生舉出了四個(gè)特點(diǎn):

量變到質(zhì)變:小樣本下,模型無(wú)法達(dá)到滿意精度,大眾就覺(jué)得模型不行,但當(dāng)樣本達(dá)到一定量,模型精度會(huì)顯著提升,從而使模型具備以前不具備的功能。

片段到全局:大數(shù)據(jù)能從多個(gè)角度判斷一個(gè)對(duì)象,許多模型都是對(duì)象的片段信息,但將這些片段組合在一起時(shí),就會(huì)在整體判斷有爆發(fā)提升。

應(yīng)用到資源:小數(shù)據(jù)下,數(shù)據(jù)是為了具體場(chǎng)景的效果提升,但當(dāng)大數(shù)據(jù)模型能夠辨識(shí)全局,數(shù)據(jù)得出的信息就會(huì)成為許多創(chuàng)新及應(yīng)用的源泉。

大數(shù)據(jù)包括多個(gè)數(shù)據(jù)處理和挖掘的環(huán)節(jié),每一個(gè)環(huán)節(jié)都是科學(xué)+藝術(shù),建模能力需要非常強(qiáng),才可能深度挖掘其價(jià)值。

數(shù)據(jù)開(kāi)放是硬道理

清華大學(xué)科學(xué)學(xué)院經(jīng)濟(jì)學(xué)教授、清華大學(xué)華商研究中心副主任劉鷹在談到“從數(shù)據(jù)、信息到知識(shí)的演變”,他的邏輯是:從數(shù)據(jù)中獲取信息,從信息中提煉知識(shí)(見(jiàn)圖)。

9

我的問(wèn)題是如何完成這個(gè)從數(shù)據(jù)到知識(shí)的提煉過(guò)程?誰(shuí)來(lái)來(lái)完成這個(gè)過(guò)程?我的理解是,任何個(gè)人是不能在大數(shù)據(jù)時(shí)代做成一件事的。如果說(shuō)在農(nóng)業(yè)時(shí)代是“三個(gè)和尚沒(méi)水喝”的話,在大數(shù)據(jù)時(shí)代則是“只有三個(gè)和尚在一起才有水喝”。

同時(shí),這三個(gè)和尚還不能是同一個(gè)師傅教出來(lái)的,第一個(gè)和尚要會(huì)statistics and machine learning;第二個(gè)和尚要有專業(yè)知識(shí),例如經(jīng)濟(jì)學(xué)、社會(huì)學(xué)和心理學(xué)等;第三個(gè)和尚要懂計(jì)算機(jī)的硬件和軟件。

三角鼎力方可百戰(zhàn)百勝!阿里研究中心將各部門打散,不同部門的人組成若干項(xiàng)目小組,大量動(dòng)用各方專家進(jìn)行合作研究,可見(jiàn)他們Boss的洞察力和領(lǐng)導(dǎo)力了!

利用數(shù)據(jù)拿到更多數(shù)據(jù)

77

電子科技大學(xué)計(jì)算機(jī)學(xué)院教授尚明生指出:數(shù)據(jù)“大小”自然是不重要的,或者說(shuō)“數(shù)據(jù)”本身就不重要,重要的是數(shù)據(jù)中隱含的“信息”。比較麻煩或者復(fù)雜的是,這個(gè)“信息”的效用沒(méi)有一般的準(zhǔn)則,因?yàn)樗ǔJ菫榱私鉀Q不同的具體問(wèn)題而言的,而問(wèn)題又可能是多種多樣的,甚至無(wú)法預(yù)知。

我們無(wú)法直接抓住所有可能的信息,只好去抓信息的來(lái)源,也就是數(shù)據(jù)。從這個(gè)角度出發(fā),這個(gè)數(shù)據(jù)就需要越大越好,這實(shí)際上是我們事先不確定其中可能有用的信息,又不想失去某個(gè)部分,再加上想偷懶,就想用同一份數(shù)據(jù),來(lái)滿足不同(的人對(duì)于他們自己感興趣)的問(wèn)題需求。

在實(shí)際應(yīng)用中,如果問(wèn)題比較固定,從抽樣理論出發(fā),數(shù)據(jù)規(guī)模是可以限定大小的;如果問(wèn)題本身發(fā)展變化,數(shù)據(jù)還會(huì)越來(lái)越大。

數(shù)據(jù)化營(yíng)運(yùn)是一種對(duì)待數(shù)據(jù)的態(tài)度

大數(shù)據(jù)的核心是以數(shù)據(jù)作為決策的依據(jù),而不是拍腦袋。大數(shù)據(jù)時(shí)候需要改變的是管理的模式,而數(shù)據(jù)量的增加僅僅是使得這種改變更加緊迫、更有基礎(chǔ)。這件事在10年前我開(kāi)始給學(xué)生講商務(wù)智能課的時(shí)候就是這樣,再回去20年這種思路就有。

從這個(gè)角度來(lái)說(shuō),數(shù)據(jù)的大小確實(shí)不重要,重要的是管理的模式和文化。今天之所以提出大數(shù)據(jù)管理,對(duì)于許多企業(yè)講其實(shí)是補(bǔ)10年(甚至更多年前)前管理理念上的課。

但是,電商在這方面占據(jù)了先機(jī),現(xiàn)有的人員、技術(shù)和管理理念基本上可以支持大數(shù)據(jù)管理,這是一些線下企業(yè),或者數(shù)據(jù)基礎(chǔ)、管理基礎(chǔ)比較差的企業(yè)望塵莫及的。數(shù)據(jù)量的積累對(duì)于這個(gè)企業(yè)而言還是重要的。

原文鏈接:http://www.leiphone.com/s-big-data-ready.html

責(zé)任編輯:彭凡 來(lái)源: 雷鋒網(wǎng)
相關(guān)推薦

2011-01-11 15:06:02

Linux安裝準(zhǔn)備

2016-07-08 15:54:00

創(chuàng)業(yè)

2013-01-28 16:51:45

2010-08-25 15:49:04

面試

2016-05-31 16:50:33

2015-06-24 16:03:24

大數(shù)據(jù).SAS

2021-04-28 11:38:10

“熄燈”數(shù)據(jù)中心數(shù)據(jù)中心運(yùn)維

2011-05-25 17:08:29

ibmdwLinux

2016-11-21 17:39:08

云計(jì)算

2019-04-18 15:32:45

Serverless騰訊云TVP

2018-10-11 17:43:15

人臉識(shí)別人工智能AI

2015-01-07 10:45:05

Dockerkubernetescontain

2015-10-19 16:51:01

2011-07-08 10:18:09

海量數(shù)據(jù)數(shù)據(jù)挖掘

2011-01-12 09:37:59

2018-10-16 18:26:52

人工智能AI

2020-03-26 17:28:22

CIO觀點(diǎn)MES系統(tǒng)制造企業(yè)

2016-11-01 13:31:27

2017大數(shù)據(jù)

2015-10-15 17:11:47

賽思股份

2011-08-30 09:28:36

編程
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)