為什么這么多數(shù)據(jù)科學(xué)家選擇辭職
數(shù)據(jù)科學(xué)家的挫折
是的,我是數(shù)據(jù)科學(xué)家。
我們讀了很多關(guān)于數(shù)據(jù)科學(xué)是21世紀(jì)最性感的工作的故事,以及作為一個(gè)數(shù)據(jù)科學(xué)家人你可以賺到的誘人的錢,這看起來(lái)像是一份絕對(duì)理想的工作。
考慮到這個(gè)領(lǐng)域有大量高技能的人專門去解決復(fù)雜的問(wèn)題(是的,“專門去”是一件積極的事情),這份工作有很多值得熱愛(ài)的地方。
但事實(shí)是,正如英國(guó)《金融時(shí)報(bào)》這篇文章所述,數(shù)據(jù)科學(xué)家通常“每周花1-2小時(shí)尋找新工作”。
此外,文章還指出,“機(jī)器學(xué)習(xí)專家在開(kāi)發(fā)者名單中排名第一,占14.3%。數(shù)據(jù)科學(xué)家緊隨其后,為13.2%。”這些數(shù)據(jù)是由堆棧溢出在基于6.4萬(wàn)名開(kāi)發(fā)人員的調(diào)查中收集的。 我也是如此,最近我自己也換了數(shù)據(jù)科學(xué)工作。 那么為什么這么多數(shù)據(jù)科學(xué)家在尋找新的工作呢?
在回答這個(gè)問(wèn)題之前,我應(yīng)該澄清一下,我仍然是一個(gè)數(shù)據(jù)科學(xué)家人??偟膩?lái)說(shuō),我喜歡這份工作,我不想阻止其他人渴望成為數(shù)據(jù)科學(xué)家,因?yàn)檫@份工作有趣、刺激且有回報(bào)。這篇文章的目的是唱反調(diào),揭露這項(xiàng)工作的一些負(fù)面影響。 在我看來(lái),我認(rèn)為許多數(shù)據(jù)科學(xué)家對(duì)他們的工作不滿意有四大原因。
期望與現(xiàn)實(shí)不符
我認(rèn)識(shí)的許多初級(jí)數(shù)據(jù)科學(xué)家(包括我自己)都想進(jìn)入數(shù)據(jù)科學(xué)領(lǐng)域,因?yàn)檫@一切都是為了用對(duì)企業(yè)產(chǎn)生巨大影響的全新機(jī)器學(xué)習(xí)算法來(lái)解決復(fù)雜的問(wèn)題。
這是一個(gè)機(jī)會(huì),讓我們覺(jué)得我們正在做的工作比我們以前做過(guò)的任何事情都重要。然而,情況往往并非如此。 在我看來(lái),期望與現(xiàn)實(shí)不符的事實(shí)是許多數(shù)據(jù)科學(xué)家離開(kāi)的最終原因。這有很多原因,我不能列一個(gè)詳盡的清單,但這篇文章基本上是我遇到的一些原因的清單。
每家公司都不一樣,所以我不能代表他們所有人,除了許多公司雇傭沒(méi)有合適基礎(chǔ)設(shè)施的數(shù)據(jù)科學(xué)家來(lái)開(kāi)始從人工智能中獲取價(jià)值。
這導(dǎo)致了人工智能中的冷啟動(dòng)問(wèn)題。再加上這些公司在雇用初級(jí)員工之前沒(méi)有雇用資深/有經(jīng)驗(yàn)的數(shù)據(jù)從業(yè)者,你現(xiàn)在已經(jīng)為雙方找到了一個(gè)幻滅和不愉快的關(guān)系的秘訣。
數(shù)據(jù)科學(xué)家人可能是來(lái)編寫(xiě)智能機(jī)器學(xué)習(xí)算法來(lái)提高洞察力的,但他們不能這樣做,因?yàn)樗麄兊牡谝豁?xiàng)工作是整理數(shù)據(jù)基礎(chǔ)設(shè)施或創(chuàng)建分析報(bào)告。
相比之下,該公司只想要一張他們可以每天在董事會(huì)上展示的圖表。然后公司會(huì)感到沮喪,因?yàn)樗麄冋J(rèn)為價(jià)值沒(méi)有被足夠快地驅(qū)動(dòng),所有這些導(dǎo)致數(shù)據(jù)科學(xué)家對(duì)他們的角色不滿意。
羅伯特·張?jiān)谒牟┛臀恼轮薪o初級(jí)數(shù)據(jù)科學(xué)家提出了一個(gè)非常有見(jiàn)地的建議: 重要的是要評(píng)估我們的愿望與我們所處環(huán)境的關(guān)鍵路徑有多一致。尋找關(guān)鍵路徑與你的最一致的項(xiàng)目、團(tuán)隊(duì)和公司。
這突出了雇主和數(shù)據(jù)科學(xué)家之間的雙向關(guān)系。如果公司不在正確的地方,或者目標(biāo)與數(shù)據(jù)科學(xué)家一致,那么數(shù)據(jù)科學(xué)家找到其他東西只是時(shí)間問(wèn)題。
對(duì)于那些感興趣的人來(lái)說(shuō),胡參孫有一個(gè)關(guān)于分析團(tuán)隊(duì)如何在Wish建立的精彩系列,我也覺(jué)得非常有見(jiàn)地。
數(shù)據(jù)科學(xué)家失望的另一個(gè)原因與我對(duì)學(xué)術(shù)界失望的原因相似:我相信我將能夠?qū)κ澜绺鞯氐娜藗儺a(chǎn)生巨大的影響,而不僅僅是在公司內(nèi)部。
事實(shí)上,如果公司的核心業(yè)務(wù)不是機(jī)器學(xué)習(xí)(我以前的雇主是一家媒體出版公司),那么你所做的數(shù)據(jù)科學(xué)很可能只會(huì)帶來(lái)微小的增量收益。這些可以累積成一些非常重要的東西,或者你可能幸運(yùn)地偶然發(fā)現(xiàn)了一個(gè)金礦項(xiàng)目,但這并不常見(jiàn)。
政治至高無(wú)上
《政治》雜志已經(jīng)有一篇精彩的文章專門討論這個(gè)問(wèn)題:數(shù)據(jù)科學(xué)中最難的事情:政治,我敦促你閱讀它。
那篇文章的前幾句話差不多概括了我想說(shuō)的話: 當(dāng)我早上6點(diǎn)醒來(lái)學(xué)習(xí)支持向量機(jī)時(shí),我想:“這真的很難!但是,嘿,至少我會(huì)對(duì)我未來(lái)的雇主變得非常有價(jià)值!”。
如果我能得到德洛爾,我會(huì)回到過(guò)去,打電話給“公牛隊(duì)”我自己。 如果你真的認(rèn)為知道很多機(jī)器學(xué)習(xí)算法會(huì)讓你成為最有價(jià)值的數(shù)據(jù)科學(xué)家,那么回到我上面的第一點(diǎn):期望與現(xiàn)實(shí)不符。
事實(shí)是,商界最有影響力的人需要對(duì)你有一個(gè)好的印象。這可能意味著你必須不斷地做一些特別的工作,比如從數(shù)據(jù)庫(kù)中獲取數(shù)字,在合適的時(shí)間給合適的人,做簡(jiǎn)單的項(xiàng)目,這樣合適的人才會(huì)對(duì)你有正確的看法。在我以前的地方,我不得不經(jīng)常這樣做。盡管令人沮喪,但這是工作中不可或缺的一部分。
對(duì)于任何數(shù)據(jù),你都是最直接的人
在做任何事情取悅合適的人之后,那些有影響力的人往往不明白“數(shù)據(jù)科學(xué)家”是什么意思。這意味著你將成為分析專家,也將成為報(bào)告專家,別忘了你也將成為數(shù)據(jù)庫(kù)專家。 對(duì)你的技能做出過(guò)多假設(shè)的不只是非技術(shù)高管。
技術(shù)領(lǐng)域的其他同事認(rèn)為你知道所有相關(guān)的數(shù)據(jù)。你知道你在Spark、Hadoop、Hive、Pig、SQL、Neo4J、MySQL、Python、r、Scala、Tensorflow、A/B測(cè)試、NLP、任何機(jī)器學(xué)習(xí)(以及任何其他你能想到的與of — BTW有關(guān)的數(shù)據(jù),如果你看到一份寫(xiě)有所有這些內(nèi)容的工作規(guī)范,請(qǐng)保持清晰。
這是一家公司的工作規(guī)范,該公司不知道他們的數(shù)據(jù)策略是什么,他們會(huì)雇用任何人,因?yàn)樗麄冋J(rèn)為雇用任何數(shù)據(jù)人員都可以解決他們所有的數(shù)據(jù)問(wèn)題)。
但它并沒(méi)有就此止步。因?yàn)槟阒浪羞@些,而且你顯然可以訪問(wèn)所有的數(shù)據(jù),所以你應(yīng)該能夠通過(guò)……得到所有問(wèn)題的答案。
嗯,它應(yīng)該在5分鐘前到達(dá)相關(guān)人員的收件箱。 試圖告訴每個(gè)人你實(shí)際知道和控制的事情可能很難。不是因?yàn)閷?shí)際上有人會(huì)對(duì)你不以為然,而是因?yàn)樽鳛橐粋€(gè)沒(méi)有什么行業(yè)經(jīng)驗(yàn)的年輕數(shù)據(jù)科學(xué)家人,你會(huì)擔(dān)心人們會(huì)對(duì)你不以為然。這可能是一個(gè)相當(dāng)困難的情況。
在孤立的團(tuán)隊(duì)中工作
當(dāng)我們看到成功的數(shù)據(jù)產(chǎn)品時(shí),我們通常會(huì)看到經(jīng)過(guò)專業(yè)設(shè)計(jì)的用戶界面,它具有智能功能,最重要的是,它是一種有用的輸出,至少用戶可以通過(guò)它來(lái)解決相關(guān)的問(wèn)題。
現(xiàn)在,如果一個(gè)數(shù)據(jù)科學(xué)家人只花時(shí)間學(xué)習(xí)如何編寫(xiě)和執(zhí)行機(jī)器學(xué)習(xí)算法,那么他們只能是團(tuán)隊(duì)中的一小部分(盡管是必要的),這將導(dǎo)致一個(gè)生產(chǎn)有價(jià)值產(chǎn)品的項(xiàng)目的成功。這意味著獨(dú)立工作的數(shù)據(jù)科學(xué)團(tuán)隊(duì)將難以提供價(jià)值!
盡管如此,許多公司仍然有數(shù)據(jù)科學(xué)團(tuán)隊(duì),他們提出自己的項(xiàng)目并編寫(xiě)代碼來(lái)嘗試解決問(wèn)題。在某些情況下,這就足夠了。
例如,如果所需要的只是一個(gè)每季度制作一次的靜態(tài)電子表格,那么它可以提供一些價(jià)值。另一方面,如果目標(biāo)是在定制的網(wǎng)站構(gòu)建產(chǎn)品中優(yōu)化提供智能建議,那么這將涉及許多不同的技能,絕大多數(shù)數(shù)據(jù)科學(xué)家不應(yīng)該期望這些技能(只有真正的數(shù)據(jù)科學(xué)獨(dú)角獸才能解決這個(gè)問(wèn)題)。
因此,如果項(xiàng)目由一個(gè)獨(dú)立的數(shù)據(jù)科學(xué)團(tuán)隊(duì)承擔(dān),它很可能會(huì)失敗(或者需要很長(zhǎng)時(shí)間,因?yàn)樵诖笮推髽I(yè)中組織獨(dú)立的團(tuán)隊(duì)來(lái)從事協(xié)作項(xiàng)目并不容易)。
因此,要成為一個(gè)有效的數(shù)據(jù)科學(xué)家,僅僅在Kaggle比賽中表現(xiàn)出色并完成一些在線課程是不夠的。幸運(yùn)的是(取決于你對(duì)它的看法),它涉及到理解等級(jí)制度和政治在商業(yè)中是如何運(yùn)作的。
在尋找一份能滿足你需求的數(shù)據(jù)科學(xué)工作時(shí),找到一家與你的關(guān)鍵路徑相一致的公司應(yīng)該是一個(gè)關(guān)鍵目標(biāo)。然而,您可能仍然需要重新調(diào)整您對(duì)數(shù)據(jù)科學(xué)角色的期望。