“數(shù)據(jù)科學(xué)家”將成無用之人?
第一條,需要“數(shù)學(xué)、統(tǒng)計、計算機等專業(yè)碩士學(xué)位,博士優(yōu)先”。小左本科畢業(yè)不久,順利的話,碩士要三年,博士再三年。這樣算來,起碼是六年以后的事了。小左在大學(xué)里也曾想過考研,最終由于家庭經(jīng)濟(jì)原因而放棄了。如今看來,要實現(xiàn)自己這個夢想,考研是必須的。專業(yè)當(dāng)然是選計算機比較理想,因其相比于數(shù)學(xué)和統(tǒng)計,與數(shù)據(jù)挖掘更接近。但在要不要讀博士的問題上,小左陷入了深深的沉思。最后決定,先讀完碩士再說吧。
接著看第二條,“有三年以上數(shù)據(jù)分析或數(shù)據(jù)挖掘方面經(jīng)驗,有數(shù)據(jù)挖掘項目實施經(jīng)驗者優(yōu)先”,這是年限要往上加的節(jié)奏了。顯然,讀完計算機碩士,職業(yè)也基本定了,就先干幾年數(shù)據(jù)分析。
第三條和第四條的英文字母讓小左有些目不暇接:“3. 熟悉一種或者幾種數(shù)據(jù)分析方面的工具,比如MATLAB、R、SPSS、SAS等,R優(yōu)先;4. 熟悉一種或者幾種主流數(shù)據(jù)庫,如MySQL、Oracle、SQL Server等,具有數(shù)據(jù)腳本編寫能力以及Hadoop經(jīng)驗者優(yōu)先”。小左此前雖然也學(xué)過一些計算機編程,但對這些工具,除了SPSS、Oracle、SQL Server等有所耳聞,其他還真沒有聽說過,另外,“R”是什么,這么厲害?看來要學(xué)的東西還真不少啊!小左感到無形的壓力在逐漸加重。
第五條看上去有點玄奧:需要“信仰并熱愛大數(shù)據(jù)”。小左心想,大數(shù)據(jù)是用來“信仰”的嗎,莫不成了一種宗教?他有些不太明白,這句不會是某個像京東劉總那樣的領(lǐng)導(dǎo)心血來潮想到的吧?
相比于第五條,第六條相對明白一點:要“較強的數(shù)據(jù)敏感度,邏輯分析能力,良好的口頭表達(dá)和文檔寫作能力”。在小左看來,自己曾受過一些邏輯和寫作方面的訓(xùn)練,加上當(dāng)過營銷員的口才,后三項能力應(yīng)該是沒有問題的,而第一項“數(shù)據(jù)敏感度”可能是最需要加強的。
最后一條與小左對于大數(shù)據(jù)的理解最為貼近,也更加具體:“能從大數(shù)據(jù)中挖掘用戶本質(zhì)屬性,并分析用戶行為和個性化需求,并不斷挖掘新的用戶屬性數(shù)據(jù)并據(jù)此產(chǎn)生創(chuàng)新的應(yīng)用”。按小左的理解,大數(shù)據(jù)本來就是對復(fù)雜現(xiàn)實世界的反映,需要找出不同數(shù)據(jù)背后所反映的一些規(guī)律性、模式性的東西,從而更好地滿足用戶需求。只要把握了用戶需求,各類創(chuàng)新的應(yīng)用自會源源而來。
上述要求確實不算低。用小左跟同學(xué)閑聊時開玩笑的話說:這數(shù)據(jù)科學(xué)家應(yīng)該是來自某個星星,與“都教授”是一個層次的。
確實,“數(shù)據(jù)科學(xué)家”被知識管理專家托馬斯·德文波特(Thomas H. Davenport)稱為“21世紀(jì)性感的工作”(the Sexiest Job)。但另一方面,據(jù)麥肯錫全球研究院2011年的預(yù)估,僅在美國,大數(shù)據(jù)方面的技術(shù)人才缺口為14-19萬,管理人才缺口達(dá)到150萬;“數(shù)據(jù)科學(xué)家”的概念則仍在形成過程中,目前尚無一所高校培育這方面的專業(yè)人才。
單從技術(shù)層面看,數(shù)據(jù)科學(xué)應(yīng)該是計算機、數(shù)學(xué)和統(tǒng)計幾個學(xué)科的交叉。但是數(shù)據(jù)分析技術(shù)僅是數(shù)據(jù)科學(xué)家工作的一部分,企業(yè)顯然并不滿足于招聘只懂得技術(shù)的人,而是希望Ta同時能與業(yè)務(wù)有良好的溝通,最好還能有一定的創(chuàng)造性,能于數(shù)據(jù)海洋中慧眼識珠。
從目前很多大數(shù)據(jù)的分析文章中,我們可以看到對數(shù)據(jù)科學(xué)家的各種理解。如有的作者提出數(shù)據(jù)科學(xué)家應(yīng)該要精通技術(shù)和數(shù)學(xué),熟悉公司業(yè)務(wù),有非凡的創(chuàng)造力,能將數(shù)據(jù)結(jié)構(gòu)化和可視化,使冷冰冰的數(shù)據(jù)變得有意義;有很多作者提出,數(shù)據(jù)科學(xué)家要會用數(shù)據(jù)來講精彩的故事,故事先于數(shù)據(jù);還有的認(rèn)為數(shù)據(jù)科學(xué)家應(yīng)當(dāng)是數(shù)據(jù)黑客、分析師、溝通師和信托理財規(guī)劃師的混合體。
德文波特對此作出總結(jié),“數(shù)據(jù)科學(xué)家最基本、最普遍的技能是會寫代碼,從長遠(yuǎn)看,是用各方能夠理解的語言進(jìn)行溝通,用數(shù)據(jù)來講故事——無論是口頭的還是書面的——最好是二者兼?zhèn)?hellip;…他們必須要有強烈的好奇性”,更高意義上,他們要能“形成自己的分析工具,甚至能開展學(xué)術(shù)類研究”。
看多了各種對數(shù)據(jù)科學(xué)家近乎神化的描述,不由讓人想起管理學(xué)大師德魯克曾經(jīng)講過的一個小故事:
“15年前,當(dāng)‘運籌學(xué)’剛開始流行的時候,有人開出了從事運籌學(xué)研究的學(xué)者應(yīng)具備的條件。他們提出的要求是,一位運籌學(xué)者應(yīng)該是一位‘萬能博士’。他應(yīng)該懂得一切,而且對人類各方面的知識都能做出最佳的應(yīng)用。甚至有人說,運籌學(xué)者必須具有62門自然科學(xué)與人文科學(xué)的知識。如果真能找到這樣一位‘萬能博士’,讓他來研究庫存水平或生產(chǎn)規(guī)劃問題,那豈不是絕大的浪費!”。
無疑,今天的“數(shù)據(jù)科學(xué)家”與當(dāng)時的“運籌學(xué)家”處于同樣的境遇。六十年過去了,我們并沒有看到在企業(yè),即使是最卓越的企業(yè)中,有所謂的“運籌學(xué)者”在進(jìn)行科學(xué)的管理,這就足夠引起警醒:要么我們對于數(shù)據(jù)科學(xué)家的崗位要求期望值有些高了;要么這個崗位根本沒有那么重要。
如果回顧上個世紀(jì)以來科學(xué)管理的發(fā)展歷程,就能清楚地看到數(shù)據(jù)科學(xué)家的工作其實與泰勒、戴明所分析的工作是一脈相承的。只不過后兩者更偏于體力勞動者的工作,而數(shù)據(jù)科學(xué)家更多面向知識工作者,嘗試借助于云計算、物聯(lián)網(wǎng)等新型信息技術(shù)的數(shù)據(jù)采集、存儲和處理能力,提升他們的工作效能。但就像企業(yè)在推廣科學(xué)管理和全面質(zhì)量管理的過程非常強調(diào)有全員的參與和支持,最終要內(nèi)化為企業(yè)的文化和精神一樣,大數(shù)據(jù)分析演化之路也絕非一兩個精英能夠推動的,它也將是一種文化。希望靠某一個天才型的崗位來驅(qū)動和改善企業(yè)的運營和決策,只是企業(yè)的一廂情愿。更有可能出現(xiàn)的結(jié)果是:數(shù)據(jù)科學(xué)家的工作將由一個核心專業(yè)團(tuán)隊來推動,盡量吸引更多的員工參與,而不是找一個來自星星的都教授這樣的超人來承擔(dān)。
當(dāng)然,對于小左這種正在幻想著的年齡的青年而言,成為一名優(yōu)秀的數(shù)據(jù)科學(xué)家的愿望仍然顯得那么真實而可貴。當(dāng)他一旦打定主意,努力前程,夢想也許并沒有看上去那么遙遠(yuǎn)。















 
 
 






 
 
 
 