偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

如何11步轉(zhuǎn)行數(shù)據(jù)科學(xué)家 (適用數(shù)據(jù)員/ MIS / BI分析師)

大數(shù)據(jù)
我經(jīng)常遇到一些優(yōu)秀的商業(yè)智能分析師 (BI),尋求獲得自己人生的第一個(gè)數(shù)據(jù)科學(xué)角色。但他們常常因缺乏機(jī)會(huì)而沮喪。他們中很多人感覺(jué)自己的角色是重復(fù)的,或者只需要扮演好被要求的角色。

數(shù)據(jù)科學(xué)作為一個(gè)專業(yè)領(lǐng)域迅速崛起,吸引了來(lái)自各種職業(yè)背景的人。工程師、計(jì)算機(jī)科學(xué)家、市場(chǎng)和金融畢業(yè)生、分析師、人力資源人員——每個(gè)人都想嘗一塊 “數(shù)據(jù)科學(xué)餡餅”。

那么,為什么我要特別關(guān)注這些職業(yè):數(shù)據(jù)分析/數(shù)據(jù)倉(cāng)庫(kù)(MIS)/商業(yè)智能(BI)呢?讓我先解釋一下。

我經(jīng)常遇到一些優(yōu)秀的商業(yè)智能分析師 (BI),尋求獲得自己人生的第一個(gè)數(shù)據(jù)科學(xué)角色。但他們常常因缺乏機(jī)會(huì)而沮喪。他們中很多人感覺(jué)自己的角色是重復(fù)的,或者只需要扮演好被要求的角色。

他們實(shí)際上忽略了一個(gè)事實(shí):比起任何其他職業(yè)的人,他們離數(shù)據(jù)科學(xué)更近。

商業(yè)智能分析師 (BI) 為何能更輕松地過(guò)渡到數(shù)據(jù)科學(xué)領(lǐng)域

商業(yè)智能專業(yè)人士比幾乎所有試圖過(guò)渡到數(shù)據(jù)科學(xué)的人都擁有巨大優(yōu)勢(shì),原因如下:

  • 商業(yè)智能分析師已經(jīng)在各個(gè)項(xiàng)目中接觸到了數(shù)據(jù)科學(xué)家;
  • 知曉如何管理和處理數(shù)據(jù)(有時(shí)按比例);
  • 有業(yè)務(wù)背景,他們密切地從事相關(guān)業(yè)務(wù);

他們有基本的數(shù)據(jù)探索步驟的經(jīng)驗(yàn),因?yàn)槌擞迷趫?bào)告中,業(yè)務(wù)部門(mén)也會(huì)經(jīng)常要求這些。

換句話說(shuō),這些人工作在數(shù)據(jù)科學(xué)項(xiàng)目的“前半部分”,這已經(jīng)比大多數(shù)有志成為數(shù)據(jù)科學(xué)家的人多了很多行業(yè)經(jīng)驗(yàn)。

如果你正是這樣一位希望從數(shù)據(jù)分析/數(shù)據(jù)倉(cāng)庫(kù)(MIS)/商業(yè)智能(BI)跳轉(zhuǎn)到數(shù)據(jù)科學(xué)家,這篇文章就是為你量身定制的。你可以將這11步作為你能遵循的學(xué)習(xí)路徑。實(shí)際上,我強(qiáng)烈建議你在當(dāng)前的角色中執(zhí)行這些步驟。開(kāi)始于你正站著的地方,直到破霧而出,進(jìn)入數(shù)據(jù)科學(xué)!我自己整理的一份新的大數(shù)據(jù)進(jìn)階資料和高級(jí)開(kāi)發(fā)教程,大數(shù)據(jù)學(xué)習(xí)群:522189307 歡迎進(jìn)階中和進(jìn)想深入大數(shù)據(jù)的小伙伴加入。

在下面的內(nèi)容中--—商業(yè)智能、數(shù)據(jù)倉(cāng)庫(kù)師、數(shù)據(jù)員、數(shù)據(jù)分析員都可以互換使用。這些角色和名稱幾乎沒(méi)有區(qū)別,而且有很多重疊。

準(zhǔn)備好和我一起踏上征程了嗎?讓我們一步一步地來(lái)。

第一步:進(jìn)行探查分析并解讀分析成果

讓我以三個(gè)BI人員日常報(bào)告的例子開(kāi)始。

示例 1:

如何11步轉(zhuǎn)行數(shù)據(jù)科學(xué)家 (適用數(shù)據(jù)員/ MIS / BI分析師)

該BI人員已經(jīng)得到了數(shù)據(jù)結(jié)果,其中包含有關(guān)城市和地區(qū)級(jí)別的業(yè)務(wù)來(lái)源,以及業(yè)務(wù)質(zhì)量的詳細(xì)信息。

示例 2:

如何11步轉(zhuǎn)行數(shù)據(jù)科學(xué)家 (適用數(shù)據(jù)員/ MIS / BI分析師)

在這里,BI人員為“拒絕分?jǐn)?shù)”列添加了RAG (紅-琥珀色-綠) 分析。拒絕分?jǐn)?shù)越低,業(yè)務(wù)質(zhì)量越高。

示例 3:

如何11步轉(zhuǎn)行數(shù)據(jù)科學(xué)家 (適用數(shù)據(jù)員/ MIS / BI分析師)

在本例中,BI人員通過(guò)對(duì)分析結(jié)果進(jìn)行解讀,將報(bào)告提升到了另一個(gè)層次。你可以看到他從報(bào)告中得出的前2個(gè)發(fā)現(xiàn)。

這里我只舉了一個(gè)簡(jiǎn)單的例子對(duì)報(bào)告進(jìn)行解讀分析。你可以根據(jù)正在分享的信息類型加入更多視覺(jué)效果/圖表。

以上哪個(gè)示例對(duì)于業(yè)務(wù)用戶更有意義?

看看上面的3個(gè)例子,我傾向于“示例3”,因?yàn)樗鼮闃I(yè)務(wù)增加了更多價(jià)值:

  • 為報(bào)告添加了更多可理解性;
  • 它還強(qiáng)調(diào)了可著手的操作領(lǐng)域;

如果你查看那些“發(fā)現(xiàn)”,其中一個(gè)是區(qū)域級(jí)別匯總報(bào)告后得出的。

這些實(shí)際上能很大地幫助業(yè)務(wù)人員。當(dāng)你與高層管理者合作時(shí),你會(huì)發(fā)現(xiàn)他們中的大多數(shù)需要可著手操作的項(xiàng)目,而不想花時(shí)間在解釋報(bào)告和深入分析上。

想要生成一份類似的報(bào)告,一位BI人員應(yīng)該具有好奇心,關(guān)注細(xì)節(jié),熟練掌握任何一種工具(Excel/SQL/QlikView/Tableau), 以及業(yè)務(wù)知識(shí)。

這個(gè)技能集不僅限于從事BI的人員。它對(duì)于成為一名好的數(shù)據(jù)科學(xué)專家也是關(guān)鍵。在大多數(shù)情況下,一名數(shù)據(jù)科學(xué)家60%—70%的工作是關(guān)于業(yè)務(wù)理解,數(shù)據(jù)探索和對(duì)手頭問(wèn)題產(chǎn)生見(jiàn)解。

與其它正在向數(shù)據(jù)科學(xué)過(guò)渡的人員相比,一位BI人士擁有巨大的優(yōu)勢(shì)。你可以從今天開(kāi)始練習(xí)這個(gè)技能集,它也將幫助你在現(xiàn)在的工作中做得更好。這是雙贏!

面臨的挑戰(zhàn)和解決方案:

無(wú)法在分析結(jié)果與業(yè)務(wù)之間建立聯(lián)系:生成見(jiàn)解與你對(duì)業(yè)務(wù)的理解直接相關(guān)。我建議你與領(lǐng)域?qū)<衣?lián)系,并嘗試解釋它正如何影響著業(yè)務(wù)指標(biāo)。

沒(méi)有足夠時(shí)間生成見(jiàn)解:我同意--—你正在緊張的期限下,忙著做業(yè)務(wù)報(bào)告,沒(méi)有時(shí)間生成見(jiàn)解。這種情況下,我有2個(gè)建議:

不要開(kāi)始一個(gè)有著非常嚴(yán)格時(shí)間表的報(bào)告(例如日?qǐng)?bào))。挑選有較少時(shí)間限制的報(bào)告任務(wù)。月報(bào)便是一個(gè)很好的開(kāi)始,因?yàn)樗鼈儼匾男畔⒉⑶覟槟闵钊胪诰蛐畔⑻峁┝藭r(shí)間。

自動(dòng)生成報(bào)告。這將為你節(jié)省大量時(shí)間,你可以利用這些時(shí)間來(lái)理解報(bào)告并生成見(jiàn)解。你應(yīng)該學(xué)習(xí) Excel/SAS 的宏指令或其它類似自動(dòng)化報(bào)告工具。

第二步:學(xué)習(xí)統(tǒng)計(jì)學(xué)以支持你對(duì)于報(bào)告的見(jiàn)解

是時(shí)候用一些統(tǒng)計(jì)指標(biāo)來(lái)支持你的見(jiàn)解了。不要把你自己局限在僅僅靠視覺(jué)解釋來(lái)生成見(jiàn)解。看看下面的圖--—你的第一反應(yīng)是什么?

如何11步轉(zhuǎn)行數(shù)據(jù)科學(xué)家 (適用數(shù)據(jù)員/ MIS / BI分析師)

這個(gè)圖上可以看到競(jìng)爭(zhēng)前和競(jìng)爭(zhēng)后的平均業(yè)務(wù)來(lái)源?,F(xiàn)在的問(wèn)題是“競(jìng)爭(zhēng)是平均業(yè)務(wù)來(lái)源增長(zhǎng)的背后推動(dòng)力,還是只是一種隨機(jī)增長(zhǎng)?”這里,我們需要依靠某些統(tǒng)計(jì)概念來(lái)支持我們的見(jiàn)解,比如做 z-檢測(cè), t-檢測(cè)或其它統(tǒng)計(jì)檢驗(yàn)。掌握好統(tǒng)計(jì)知識(shí)將在這些處境中幫助到你。

你應(yīng)該對(duì)以下統(tǒng)計(jì)主題有扎實(shí)的理解,如果你想進(jìn)入數(shù)據(jù)科學(xué)角色的話:

  • 描述性統(tǒng)計(jì)
  • 平均數(shù),中位數(shù),眾數(shù)
  • 方差和標(biāo)準(zhǔn)差
  • 概率
  • 伯努利試驗(yàn)與概率質(zhì)量函數(shù)
  • 中心極限定理
  • 正態(tài)分布
  • 推論統(tǒng)計(jì)學(xué)
  • 置信區(qū)間
  • 假設(shè)檢驗(yàn)
  • 協(xié)方差/相關(guān)性

面臨的挑戰(zhàn)和解決方案:

描述性統(tǒng)計(jì)很容易理解,但推理統(tǒng)計(jì)的茶不好喝:實(shí)踐是關(guān)鍵。我建議盡可能地多練習(xí),并對(duì)概念有一個(gè)直觀的理解。在看數(shù)學(xué)方程前先做這件事。這種方法將幫助你首先關(guān)注于應(yīng)用方面,而不是陷入理論的泥潭中。

這些看起來(lái)都太統(tǒng)計(jì)學(xué)了,我無(wú)法和股東或客戶分享:查看這些報(bào)告的客戶大致有兩類。第一類對(duì)直觀的見(jiàn)解更感興趣,而另一類(風(fēng)險(xiǎn)/數(shù)據(jù)科學(xué)團(tuán)隊(duì))則更關(guān)注統(tǒng)計(jì)見(jiàn)解。與后一類人聯(lián)系,并就你的發(fā)現(xiàn)展開(kāi)討論。此外,這里好的策略是用他們的語(yǔ)言討論業(yè)務(wù),而不是統(tǒng)計(jì)語(yǔ)言。例如,開(kāi)始時(shí)我不會(huì)使用“統(tǒng)計(jì)顯著”一詞,聽(tīng)眾可能會(huì)感到不舒服。我只會(huì)說(shuō),相比于我們從過(guò)去中看到的,這個(gè)事件是否有足夠大的可能性發(fā)生。

第三步:把你的發(fā)現(xiàn)呈現(xiàn)給正確的小組

如果你沒(méi)有和正確的小組分享你的發(fā)現(xiàn),那探查分析和統(tǒng)計(jì)分析將不會(huì)幫助你進(jìn)入數(shù)據(jù)科學(xué)的角色。

“講故事是一名數(shù)據(jù)科學(xué)專家必須掌握的關(guān)鍵技能。”

這里,我強(qiáng)烈建議在你現(xiàn)有的角色中練習(xí)“講故事”的能力。你可以從以下內(nèi)容開(kāi)始:

  • 始終在你的報(bào)告或分析中分享詳細(xì)的見(jiàn)解;

分享你的見(jiàn)解并通過(guò)演示幻燈片展示你的故事。

這是一個(gè)我個(gè)人職業(yè)生涯非常受益的基本建議——在你的幻燈片中添加可視化效果。如果是報(bào)告或會(huì)議演講,則應(yīng)該對(duì)應(yīng)你的可視化添加背景。困惑嗎?讓我用一個(gè)例子來(lái)解釋一下。

如何11步轉(zhuǎn)行數(shù)據(jù)科學(xué)家 (適用數(shù)據(jù)員/ MIS / BI分析師)

看看下面的可視化。它展示了關(guān)于Sachin Tendulkar職業(yè)生涯中測(cè)試賽的細(xì)節(jié)。你可以在這里使用圖表和數(shù)字討論各種度量。這也展示了為何業(yè)務(wù)理解如此重要——如果你沒(méi)有業(yè)務(wù)經(jīng)驗(yàn)的話,你根本無(wú)法討論這些指標(biāo)。

面臨的挑戰(zhàn)和解決方案:

不能向小組傳達(dá)統(tǒng)計(jì)見(jiàn)解:不要總使用單一語(yǔ)言(統(tǒng)計(jì)語(yǔ)言)進(jìn)行溝通。我們應(yīng)當(dāng)根據(jù)聽(tīng)眾來(lái)改變我們溝通的方式。例如,你正和一個(gè)統(tǒng)計(jì)小組溝通,那話語(yǔ)中有很多統(tǒng)計(jì)推斷沒(méi)問(wèn)題。如果你與一個(gè)非技術(shù)團(tuán)隊(duì)溝通,統(tǒng)計(jì)和直觀結(jié)合的方式將更有幫助。

以前從未分享過(guò)見(jiàn)解,怎么開(kāi)始?你可能有過(guò)這樣的想法:

這些見(jiàn)解對(duì)于業(yè)務(wù)來(lái)說(shuō)有意義嗎?

我可能誤解了這些數(shù)字。這將導(dǎo)致溝通不良并產(chǎn)生負(fù)面影響。

你的擔(dān)心是可理解的,但你不得不從某個(gè)地方開(kāi)始積累經(jīng)驗(yàn)。我的建議是首先和你的經(jīng)理、有經(jīng)驗(yàn)的同事或你的客戶分享見(jiàn)解。這將給你信心——這是非常重要的推動(dòng)力。所以開(kāi)始練習(xí)吧!

第四步:探索一個(gè)開(kāi)源工具來(lái)生成報(bào)告或執(zhí)行檢測(cè)分析

到目前為止,我還沒(méi)有討論任何生成報(bào)告和見(jiàn)解的工具。我特意回避了這樣的問(wèn)題,例,你該選擇哪樣工具?哪個(gè)是合適的或更好的?這是因?yàn)槲业哪繕?biāo)是讓你的關(guān)注點(diǎn)聚焦于檢測(cè)分析、統(tǒng)計(jì)概念和磨練你的溝通技巧,這樣你可以用你現(xiàn)在工作中的工具來(lái)展現(xiàn)你的新發(fā)現(xiàn)。

現(xiàn)在,是時(shí)候來(lái)學(xué)習(xí)一種工具了,它具有以下特點(diǎn):

  • 處理(大量)數(shù)據(jù)的能力;
  • 可視化能力;
  • 建立預(yù)測(cè)模型的能力(機(jī)器學(xué)習(xí)模型);
  • 深度學(xué)習(xí)支持;
  • 客戶服務(wù)支持和繁榮的社區(qū)。

你可以在 SAS/R/Python中任意選擇,因?yàn)檫@些工具都有以上功能。在這里,你的初始任務(wù)是非常具體的,在學(xué)習(xí)一個(gè)新工具的同時(shí),讓你自己習(xí)慣執(zhí)行數(shù)據(jù)探索、可視化、檢測(cè)分析和統(tǒng)計(jì)測(cè)試。你不需要在這些工具上擁有完整的專業(yè)知識(shí)(不管怎樣,開(kāi)始時(shí)不需要)

如何11步轉(zhuǎn)行數(shù)據(jù)科學(xué)家 (適用數(shù)據(jù)員/ MIS / BI分析師)

面臨的挑戰(zhàn)和解決方案:

 

沒(méi)有編程經(jīng)驗(yàn):記住,你無(wú)需成為該工具的專家。重點(diǎn)是你該用一個(gè)新工具來(lái)執(zhí)行相同的練習(xí)(如探索,可視化或統(tǒng)計(jì)檢驗(yàn))。你將通過(guò)練習(xí)掌握這些技能和工具。

當(dāng)前的數(shù)據(jù)科學(xué)團(tuán)隊(duì)在SAS上工作,我該轉(zhuǎn)移到Python/R上嗎?我建議只從SAS開(kāi)始。始終選擇當(dāng)前組織中的數(shù)據(jù)科學(xué)團(tuán)隊(duì)正在使用的工具。這將有助于你向數(shù)據(jù)科學(xué)過(guò)渡。

第五步:了解建模/預(yù)測(cè)建模的步驟

現(xiàn)在終于到了數(shù)據(jù)科學(xué)最吸引人的部分——建模!在你投身于研究具體模型前,我建議你首先理解存在的問(wèn)題類型。

大體上,我們可以將建模過(guò)程分為5步:

  • 定義問(wèn)題
  • 生成假設(shè)
  • 探索數(shù)據(jù)
  • 模型建立
  • 模型評(píng)估和驗(yàn)證

我將前兩步放到后面講(定義問(wèn)題和生成假設(shè))。這里我們先討論探索數(shù)據(jù)。

探索分析的步驟類似于檢測(cè)分析,這里我們的主要目標(biāo)是理解每個(gè)變量的行為和它們互相的關(guān)系。良好的統(tǒng)計(jì)知識(shí)將對(duì)你有很大幫助。這一步的終點(diǎn)是生成見(jiàn)解和數(shù)據(jù)清洗。你可能需要輸入丟失值,檢測(cè)和處理異常值和執(zhí)行多種類型的轉(zhuǎn)換。

面臨的挑戰(zhàn)和解決方案:

它是如何區(qū)分于檢測(cè)分析的:它與檢測(cè)分析類似,添加了數(shù)據(jù)清洗和轉(zhuǎn)換步驟。這里,你的重點(diǎn)應(yīng)該是進(jìn)行數(shù)據(jù)探索以實(shí)現(xiàn)特定目標(biāo),例如判斷“給定變量”是否會(huì)對(duì)目標(biāo)變量產(chǎn)生影響。

在沒(méi)有首先陳述問(wèn)題時(shí),我將如何建立和目標(biāo)變量的關(guān)系?你可以使用定義了問(wèn)題語(yǔ)句的任何開(kāi)放數(shù)據(jù)集,并開(kāi)始練習(xí)你的數(shù)據(jù)探索技能。

第六步:評(píng)估模型性能的方法

在模型構(gòu)建的過(guò)程中,我們?cè)谝粋€(gè)預(yù)先知道了目標(biāo)的數(shù)據(jù)集上訓(xùn)練模型,然后將其應(yīng)用到測(cè)試數(shù)據(jù)集上,以預(yù)測(cè)目標(biāo)變量。我們顯然希望在預(yù)測(cè)目標(biāo)變量時(shí)足夠準(zhǔn)確。

如何檢查模型是否準(zhǔn)確?我們需要一個(gè)能根據(jù)實(shí)際觀察結(jié)果去評(píng)估模型結(jié)果方法。讓我們用一個(gè)例子來(lái)理解這一點(diǎn):

[[262651]]

我們有一個(gè)客戶群,C1、C2和C3。我們估計(jì)只有C3會(huì)購(gòu)買(mǎi)產(chǎn)品A。然而事實(shí)證明,C2和C3都買(mǎi)了這件商品。這意味著我們的準(zhǔn)確率是 66.6%。這個(gè)準(zhǔn)確率就被稱為“評(píng)估指標(biāo)”。

評(píng)估指標(biāo)將根據(jù)你正在解決的問(wèn)題類型而不同。

現(xiàn)在你已經(jīng)決定了評(píng)估指標(biāo)的方法,但你有“實(shí)際結(jié)果”來(lái)評(píng)估你的模型嗎?你不能跳到未來(lái)去準(zhǔn)備一個(gè)測(cè)試數(shù)據(jù)集!在這種情況下,我們保留了數(shù)據(jù)集的一個(gè)特定樣本,該樣本集不用來(lái)訓(xùn)練模型。稍后我們用這個(gè)樣本集來(lái)評(píng)估模型。這種方法稱為模型驗(yàn)證。面臨的挑戰(zhàn)和解決方案:

有必要知道所有的評(píng)估指標(biāo)嗎?不一定。目前,只關(guān)注兩個(gè)評(píng)估指標(biāo)—“RMSE” 和“混淆矩陣”。這兩個(gè)對(duì)于起步已經(jīng)足夠了。你可以使用RMSE應(yīng)對(duì)回歸問(wèn)題,用混淆矩陣來(lái)應(yīng)對(duì)分類問(wèn)題。

第七步:用線性回歸和邏輯回歸介紹預(yù)測(cè)建模

你已經(jīng)了解了數(shù)據(jù)集并查看了評(píng)估模型性能的指標(biāo)。下一步是什么?

應(yīng)用建模技術(shù)!不要同時(shí)學(xué)習(xí)各種技術(shù)?,F(xiàn)在只關(guān)注兩個(gè):

  • 線性回歸
  • 邏輯回歸

這兩個(gè)技術(shù)將幫助你預(yù)測(cè)連續(xù)變量和分類變量。

如何11步轉(zhuǎn)行數(shù)據(jù)科學(xué)家 (適用數(shù)據(jù)員/ MIS / BI分析師)

例如:

  • 線性回歸將幫助你預(yù)測(cè)下個(gè)季度保險(xiǎn)公司銷售代理的預(yù)期業(yè)績(jī)。
  • 邏輯回歸將幫助你了解交叉銷售產(chǎn)品給特定客戶的可能性。

面臨的挑戰(zhàn)和解決方案:

算法太數(shù)學(xué)化,難以理解:首先你要對(duì)這些技術(shù)建立一個(gè)直觀的理解,然后再深入到數(shù)學(xué)細(xì)節(jié)。這里我建議采用自上而下的方法,更多地關(guān)注實(shí)際方面。你必須能夠解釋模型結(jié)果(例如了解該模型是否運(yùn)行良好)

第八步:確定業(yè)務(wù)問(wèn)題(與你的角色相關(guān))將其轉(zhuǎn)換為數(shù)據(jù)問(wèn)題并進(jìn)行預(yù)測(cè)

那么,哪里可以找到你所在領(lǐng)域的數(shù)據(jù)集呢?找到一個(gè)商業(yè)問(wèn)題可能很困難。

你應(yīng)該與領(lǐng)導(dǎo)層或團(tuán)隊(duì)經(jīng)理交談,并將他們的業(yè)務(wù)挑戰(zhàn)之一作為你的項(xiàng)目。這里,第一步是將業(yè)務(wù)問(wèn)題轉(zhuǎn)換成數(shù)據(jù)問(wèn)題。然后,開(kāi)始順著以下步驟前進(jìn)(我們?cè)谇懊娴?點(diǎn)中討論過(guò))——生成假設(shè),收集數(shù)據(jù),探索數(shù)據(jù),數(shù)據(jù)清理,模型構(gòu)建和驗(yàn)證。

作為一名BI專業(yè)人員,你具有的優(yōu)勢(shì)之一是你已經(jīng)熟悉數(shù)據(jù)集中的變量。你的檢測(cè)分析技能將幫助你理解變量間的關(guān)系。你可以跳轉(zhuǎn)到數(shù)據(jù)清理、轉(zhuǎn)換、確定正確的評(píng)估度量、設(shè)置驗(yàn)證集以及最終構(gòu)建模型等任務(wù)。

面臨的挑戰(zhàn)和解決方案:

無(wú)法找到業(yè)務(wù)問(wèn)題:你可能遭遇這樣的處境,你無(wú)法獲得業(yè)務(wù)問(wèn)題或不能說(shuō)服業(yè)務(wù)/團(tuán)隊(duì)經(jīng)理了解你的技能集。如果這正是你目前的處境,那么你可以試試這些方法:

以你自己的能力開(kāi)始構(gòu)建模型,以獲得更為明確的問(wèn)題陳述:假設(shè)你要分析保險(xiǎn)代理逐月的業(yè)務(wù)來(lái)源。你可以在制作分析報(bào)告時(shí)考慮預(yù)測(cè)代理們下個(gè)月的表現(xiàn)。你可以基于過(guò)去已有的人口統(tǒng)計(jì)或業(yè)績(jī)表現(xiàn)數(shù)據(jù)。一個(gè)月后你再來(lái)驗(yàn)證你的結(jié)果,檢查你的預(yù)測(cè)有多好。

參加開(kāi)放的數(shù)據(jù)科學(xué)競(jìng)賽,提高自己的形象:參加數(shù)據(jù)科學(xué)競(jìng)賽是一個(gè)極好學(xué)習(xí)數(shù)據(jù)科學(xué)的方式,這將提高你的知識(shí)和形象,以及了解你相對(duì)于世界頂級(jí)科學(xué)家所處的位置。

第九步:與企業(yè)主分享你的模型結(jié)果,獲得他們的信任

[[262653]]

在構(gòu)建模型后,你應(yīng)該與你的主管或決策者共享結(jié)果(如團(tuán)隊(duì)或項(xiàng)目經(jīng)理)。作為一名數(shù)據(jù)科學(xué)專家,分享你的發(fā)現(xiàn)是非常重要的(比如哪些特征會(huì)對(duì)目標(biāo)變量產(chǎn)生影響)。你還應(yīng)該圍繞模型結(jié)果和實(shí)際數(shù)字之間的比較進(jìn)行定期更新。

這個(gè)過(guò)程將也會(huì)幫助你調(diào)整和改進(jìn)你的模型。如果模型運(yùn)行良好,那么你很有可能獲得另外一個(gè)任務(wù)或參與到核心的數(shù)據(jù)科學(xué)團(tuán)隊(duì)中的機(jī)會(huì)。這也正是我們的目標(biāo),不是嗎?

面臨的挑戰(zhàn)和解決方案:

我的模型表現(xiàn)不好,那我該怎么辦呢?沒(méi)關(guān)系的。你可以進(jìn)一步研究數(shù)據(jù)集和尋找問(wèn)題??梢躁P(guān)注不同的算法,它可能更適合你正在解決的問(wèn)題。

第十步:不斷學(xué)習(xí)新算法,參加數(shù)據(jù)科學(xué)社團(tuán),專注構(gòu)建個(gè)人檔案

在數(shù)據(jù)科學(xué)領(lǐng)域,學(xué)習(xí)永無(wú)止境。這是一個(gè)不斷發(fā)展的領(lǐng)域,我們需要同它一起不斷進(jìn)化。至此你已經(jīng)學(xué)習(xí)了線性回歸和邏輯回歸,是時(shí)候擴(kuò)展你的知識(shí),超越自己了。學(xué)習(xí)決策樹(shù),隨機(jī)森林,甚至神經(jīng)網(wǎng)絡(luò)等算法。

就像我之前提到過(guò)的,你應(yīng)該在實(shí)踐中學(xué)習(xí)。擁有算法知識(shí)固然很好,但除非你能把它應(yīng)用于實(shí)踐中。撿回我們之前用過(guò)的數(shù)據(jù)集,并應(yīng)用這些新算法。你很可能將看到你的模型有了巨大的改善。

現(xiàn)在,讓我們?cè)诠ぞ吆图夹g(shù)之外更進(jìn)一步。我想強(qiáng)調(diào)在數(shù)據(jù)科學(xué)社區(qū)構(gòu)建你的社交網(wǎng)絡(luò)和個(gè)人資料的重要性。

[[262654]]

開(kāi)始參加以數(shù)據(jù)科學(xué)為中心的會(huì)議。你將遇到志趣相投的人,還有可以給你指導(dǎo)的經(jīng)驗(yàn)豐富的專家。我看到過(guò)很多有抱負(fù)的數(shù)據(jù)科學(xué)人員通過(guò)這些活動(dòng)獲得了工作機(jī)會(huì),所以我可以擔(dān)保這確實(shí)有用!

你應(yīng)該關(guān)注個(gè)人資料的數(shù)字化方面。既然你一直在與數(shù)據(jù)科學(xué)項(xiàng)目合作,那就向社區(qū)展示你的工作!將代碼上傳到Gitthub上并開(kāi)始發(fā)布關(guān)于你的發(fā)現(xiàn)的博客/文章。這將有助于你未來(lái)的雇主看到,你對(duì)某些項(xiàng)目有著很好的理解。

面臨的挑戰(zhàn)和解決方案:

我不能決定我該研究哪種算法:這是一個(gè)經(jīng)典問(wèn)題。曾讓很多有志的數(shù)據(jù)科學(xué)家感到困惑。我的建議是研究你現(xiàn)在的組織中使用的算法。這使你的目光聚焦在你們的數(shù)據(jù)科學(xué)團(tuán)隊(duì)需要的東西上。之前我們提到過(guò)組織內(nèi)部轉(zhuǎn)型,還記得嗎?這是一個(gè)很好向已有的數(shù)據(jù)科學(xué)團(tuán)隊(duì)展示你的價(jià)值的方法。

我不知道從哪里找到小組或加入哪里組織?由于數(shù)據(jù)科學(xué)的蓬勃發(fā)展,有很多相關(guān)會(huì)議。如果你無(wú)法在你所在的城市找到,那你可以自己主辦一次。我看到過(guò)很多人主動(dòng)在Linkedin和meetup.com上發(fā)布聚會(huì)詳細(xì)信息,并要求加入他們的社交網(wǎng)絡(luò)。你會(huì)對(duì)出現(xiàn)的人感到驚訝。

第十一步:在你的組織中專注地向數(shù)據(jù)科學(xué)角色過(guò)渡

[[262655]]

雖然并沒(méi)有簡(jiǎn)單的方法過(guò)渡到數(shù)據(jù)科學(xué),但還是有確定的、常有人走的路徑。其中之一是從你現(xiàn)在的組織中切換到數(shù)據(jù)科學(xué)團(tuán)隊(duì)。讓我解釋一下為什么你該關(guān)注這種方式而不是其他路徑(至少對(duì)于初學(xué)者來(lái)說(shuō)):

你已經(jīng)知道該領(lǐng)域是如何運(yùn)作的。面對(duì)數(shù)據(jù)集中的某些變量,你非常擅長(zhǎng)處理它們,因?yàn)槟憔哂兴璧臉I(yè)務(wù)知識(shí)。

你的領(lǐng)導(dǎo)和團(tuán)隊(duì)經(jīng)理已經(jīng)熟悉你的表現(xiàn)和職業(yè)道德。他們知道你帶來(lái)了什么——信任是任何一個(gè)團(tuán)隊(duì)中的重要因素,尤其是數(shù)據(jù)科學(xué)團(tuán)隊(duì)。這將對(duì)你有利。

無(wú)需花時(shí)間在組織外尋找工作機(jī)會(huì)。每個(gè)人都恐懼在招聘門(mén)戶上看著時(shí)間溜走而無(wú)法指望能找到一份體面的工作。

這可能不適用于所有人,但當(dāng)你切換組織時(shí),你可能無(wú)法指望大幅的工資增長(zhǎng)。記住,你是要過(guò)渡到你經(jīng)驗(yàn)有限的部門(mén)。

你只要記住這一點(diǎn),總是在你現(xiàn)在的公司中尋找機(jī)會(huì)。與高層或數(shù)據(jù)科學(xué)團(tuán)隊(duì)交談。建立你的社交網(wǎng)絡(luò),相信我,它最終會(huì)有回報(bào)的。

面臨的挑戰(zhàn)和解決方案:

無(wú)法在目前的組織中找到機(jī)會(huì):如果這種情況發(fā)生了,你應(yīng)該撒一張大網(wǎng)。正如我們前面步驟中討論的,你的Linkedin網(wǎng)絡(luò)和數(shù)據(jù)科學(xué)社區(qū)將派上用場(chǎng)。不要堅(jiān)持用在線求職門(mén)戶被動(dòng)求職——通過(guò)Lindedin和其它專業(yè)網(wǎng)絡(luò)聯(lián)系招聘經(jīng)理。線上展示你的項(xiàng)目。別放棄!這將考驗(yàn)?zāi)愕哪托?,但第一次的突破值得你所付出的所有努力?/p>

結(jié)束語(yǔ)

這是一段令人興奮的旅程。我已經(jīng)在幾年前經(jīng)歷過(guò)了這樣的過(guò)渡。我看到這個(gè)領(lǐng)域隨著時(shí)間推移而發(fā)展,本文的目的是幫助你實(shí)現(xiàn)轉(zhuǎn)變。你目前已經(jīng)完成了很多其它向數(shù)據(jù)科學(xué)過(guò)渡的人沒(méi)有完成的步驟。記住這一點(diǎn)。

 

責(zé)任編輯:未麗燕 來(lái)源: 阿里云棲社區(qū)
相關(guān)推薦

2017-03-07 10:37:05

非數(shù)據(jù)數(shù)據(jù)分析

2017-08-04 15:53:10

大數(shù)據(jù)真?zhèn)螖?shù)據(jù)科學(xué)家

2012-03-16 13:12:06

2015-11-04 10:10:05

信息圖數(shù)據(jù)分析科學(xué)家

2019-08-13 21:44:46

數(shù)據(jù)科學(xué)家數(shù)據(jù)分析師數(shù)據(jù)

2020-06-15 15:43:23

數(shù)據(jù)科學(xué)家數(shù)據(jù)分析師數(shù)據(jù)科學(xué)

2015-07-28 17:00:30

2020-07-30 23:25:07

數(shù)據(jù)分析師數(shù)據(jù)科學(xué)家職位

2018-02-28 15:03:03

數(shù)據(jù)科學(xué)家數(shù)據(jù)分析職業(yè)

2012-12-26 10:51:20

數(shù)據(jù)科學(xué)家

2018-12-24 08:37:44

數(shù)據(jù)科學(xué)家數(shù)據(jù)模型

2015-08-28 09:22:07

數(shù)據(jù)科學(xué)

2016-11-10 08:44:45

數(shù)據(jù)挖掘分析

2019-02-25 22:57:22

數(shù)據(jù)工程師數(shù)據(jù)科學(xué)機(jī)器學(xué)習(xí)

2020-05-29 10:16:45

數(shù)據(jù)科學(xué)數(shù)據(jù)科學(xué)家軟件工程師

2018-08-01 15:22:36

數(shù)據(jù)科學(xué)家數(shù)據(jù)科學(xué)分析

2023-03-20 13:39:00

數(shù)據(jù)分析開(kāi)源

2020-12-09 06:25:19

ETL數(shù)據(jù)分析數(shù)據(jù)科學(xué)家

2018-10-16 14:37:34

數(shù)據(jù)科學(xué)家數(shù)據(jù)分析數(shù)據(jù)科學(xué)

2012-06-12 09:33:59

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)