數(shù)據(jù)科學(xué)VS統(tǒng)計(jì)學(xué):你屬于哪種職業(yè),要不要轉(zhuǎn)行?
本文轉(zhuǎn)載自公眾號(hào)“讀芯術(shù)”(ID:AI_Discovery)。
21世紀(jì)初,也許數(shù)據(jù)科學(xué)家的頭銜在任何行業(yè)都不常見,但它迅速成為近幾年職業(yè)趨勢中爆發(fā)的熱詞。我們真的是第一次看到這樣的工作嗎?事實(shí)上,早在數(shù)據(jù)科學(xué)出現(xiàn)之前,我們已經(jīng)有了一個(gè)非常相似的職業(yè),現(xiàn)在也依然存在著——那就是統(tǒng)計(jì)學(xué)家。
兩者的區(qū)別是什么?它們有什么相似之處?本文就將來回答這些問題。
數(shù)據(jù)科學(xué)家
這個(gè)角色最近變得非常受歡迎是有原因的。當(dāng)你需要為公司招聘一位數(shù)據(jù)科學(xué)家時(shí),你正在將多種角色融合到一個(gè)職位中。
成為一名數(shù)據(jù)科學(xué)家所需要的技能令人望而生畏,這個(gè)職業(yè)通常是跨職能的——需要同時(shí)掌握業(yè)務(wù)的技術(shù)技能和軟技能。僅僅懂得編碼技術(shù)還不夠,還要知道如何與非技術(shù)性的利益相關(guān)者和公司領(lǐng)導(dǎo)一起解決重要的業(yè)務(wù)問題。有一些直接的技能是數(shù)據(jù)科學(xué)家需要知道的,但是有一些與職業(yè)不相稱的技能,也必須在一些情況下通過一段時(shí)間的實(shí)踐來掌握。
這些技能技術(shù)含量較低,通常包括但不限于:形成一個(gè)問題,形成一個(gè)問題陳述,為回答該問題創(chuàng)建一個(gè)過程,向利益相關(guān)者展示發(fā)現(xiàn)并解釋結(jié)果。
數(shù)據(jù)科學(xué)所需的一些關(guān)鍵技能:機(jī)器學(xué)習(xí)庫、Python、R編程、SQL……
統(tǒng)計(jì)學(xué)家
統(tǒng)計(jì)學(xué)家這一職業(yè)比數(shù)據(jù)科學(xué)家早出現(xiàn)很多年,無數(shù)的行業(yè)都需要這個(gè)職位。如果你想在醫(yī)療保健、安全、學(xué)術(shù)、市場營銷、經(jīng)濟(jì)等多個(gè)領(lǐng)域工作,你一定要成為該領(lǐng)域的統(tǒng)計(jì)學(xué)家。
統(tǒng)計(jì)學(xué)家的主要職責(zé)包括但不限于:實(shí)驗(yàn)設(shè)計(jì)、開展研究、估算和開展調(diào)查。你還需要有強(qiáng)大的數(shù)學(xué)和實(shí)驗(yàn)設(shè)計(jì)背景。這個(gè)職位還需要軟技能,包括向利益相關(guān)者報(bào)告你的調(diào)查結(jié)果,以及根據(jù)這些統(tǒng)計(jì)結(jié)果所需要的相應(yīng)改變。
統(tǒng)計(jì)所需的一些關(guān)鍵技能:SAS編程、實(shí)驗(yàn)、設(shè)計(jì)、數(shù)學(xué)……
相似性
如你所見,即使這兩個(gè)職業(yè)所需的一些技能并不完全相同,但有一些是相似的。以下是這兩個(gè)職業(yè)的一些相似之處:
- 對數(shù)學(xué)的理解力
- 調(diào)查問題
- 探索性數(shù)據(jù)分析
- 趨勢分析
- 預(yù)見性
- 可視化
- 向非技術(shù)用戶報(bào)告調(diào)查結(jié)果
當(dāng)然不止于此,這些僅僅是我在自己所了解到的職業(yè)以及各自的工作描述中遇到的一些相似之處。統(tǒng)計(jì)是否會(huì)隨著時(shí)間的推移變得更像數(shù)據(jù)科學(xué),還是反過來——或者它們是否會(huì)相互分化,這是一個(gè)有趣的問題。
差異性
現(xiàn)在,我們來討論一下這些職業(yè)之間的區(qū)別。首先,統(tǒng)計(jì)學(xué)家比數(shù)據(jù)科學(xué)家存在的時(shí)間要長得多,這意味著差異可能存在于新技術(shù)中。
統(tǒng)計(jì)主要包括:
- 一次性報(bào)告
- 使用SAS編程
- 關(guān)注線性回歸診斷圖
- 重視顯著性檢驗(yàn)
- 注重t檢驗(yàn)、方差分析和多元方差分析等
- 收集更多的人工數(shù)據(jù)(有時(shí)來自調(diào)查)
- 通常情況下,統(tǒng)計(jì)學(xué)家常見于醫(yī)療保健和經(jīng)濟(jì)領(lǐng)域
- 更學(xué)術(shù)化
數(shù)據(jù)科學(xué)主要包括:
- 自動(dòng)化
- 使用SQL查詢收集數(shù)據(jù)
- 機(jī)器學(xué)習(xí)庫,如 sklearn和TensorFlow
- 使用Python和R編程語言
- 部署自動(dòng)模型(用于應(yīng)用程序)
- 重視軟件工程實(shí)踐
以上描述的差異也可以從工作描述和個(gè)人經(jīng)驗(yàn)中感受到。由于公司不同,你可能會(huì)發(fā)現(xiàn)這些技能有重疊的部分。
綜上所述,統(tǒng)計(jì)學(xué)家和數(shù)據(jù)科學(xué)家,數(shù)據(jù)科學(xué)研究和統(tǒng)計(jì)研究的區(qū)別是什么?可以用一個(gè)詞來概括——新技術(shù)帶來的自動(dòng)化。
其中的一個(gè)職業(yè)比另一個(gè)更重要嗎?不,它們都是重要的角色。如果你想專注于顯著性、檢驗(yàn)、實(shí)驗(yàn)設(shè)計(jì)、正態(tài)分布和診斷性繪圖,那么去當(dāng)統(tǒng)計(jì)學(xué)家吧。如果你想練習(xí)更多的軟件工程,比如編碼和機(jī)器學(xué)習(xí)模型的自動(dòng)化,就去當(dāng)數(shù)據(jù)科學(xué)家吧。你會(huì)發(fā)現(xiàn),這兩個(gè)職業(yè)的很多工作描述互相重疊,但很少發(fā)現(xiàn)統(tǒng)計(jì)學(xué)家需要使用機(jī)器學(xué)習(xí)庫。
希望這篇文章對正在考慮開始新職業(yè)或轉(zhuǎn)行的你有幫助。
























