如何脫穎而出??jī)?yōu)秀數(shù)據(jù)科學(xué)家的五大品質(zhì)
本文轉(zhuǎn)載自公眾號(hào)“讀芯術(shù)”(ID:AI_Discovery)。
數(shù)據(jù)科學(xué)是一個(gè)絕佳的研究領(lǐng)域,想要在這一領(lǐng)域獲得成功,你有一些必需的特質(zhì)。我們都曾無(wú)數(shù)次聽(tīng)說(shuō),數(shù)據(jù)科學(xué)是現(xiàn)在和未來(lái)的就業(yè)市場(chǎng),在很大程度上,這確實(shí)是正確的。對(duì)于受過(guò)良好教育的數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)的從業(yè)者們而言,有無(wú)數(shù)的機(jī)遇和無(wú)限的空間。
專(zhuān)業(yè)技術(shù)顯然是所有領(lǐng)域的基本要求,也是所有學(xué)科的實(shí)踐中最重要的要求。但是,成為一個(gè)成功的數(shù)據(jù)科學(xué)家所需的獨(dú)特品質(zhì)是什么呢?在交流并了解了數(shù)據(jù)科學(xué)家如何工作之后,筆者確定了成為成功的數(shù)據(jù)科學(xué)家的五大重要特質(zhì)。
適應(yīng)力與創(chuàng)造力
卓越的數(shù)據(jù)科學(xué)家所擁有的一個(gè)極其有用的特質(zhì)是通過(guò)適應(yīng)現(xiàn)代技術(shù)或獨(dú)特技術(shù)來(lái)解決復(fù)雜的任務(wù),以達(dá)到最好的效果,以及創(chuàng)造性地解決工作,并以較低的空間和時(shí)間復(fù)雜度完成工作,即消耗最少的可用資源,盡可能快地高效完成工作。
數(shù)據(jù)科學(xué)家要解決的每一個(gè)任務(wù)都有其獨(dú)特之處,這些復(fù)雜的任務(wù)有各種不同的解決方法,因此,即使是最佳的解決方法也會(huì)有相應(yīng)的差異。所以,適應(yīng)力是產(chǎn)生最佳結(jié)果的一個(gè)重要方面。
創(chuàng)造性、批判性和分析性思維是數(shù)據(jù)科學(xué)家最吸引人的特點(diǎn)。跳出思維定式,實(shí)施創(chuàng)新想法的能力是一個(gè)成功的數(shù)據(jù)科學(xué)家所必需的。這些特質(zhì)是在行業(yè)層面表現(xiàn)突出的關(guān)鍵。
溝通技巧
有效交流是生活中大多數(shù)事情的核心概念,在大多數(shù)工作中也是如此。尤其在數(shù)據(jù)科學(xué)領(lǐng)域,溝通技巧起到關(guān)鍵作用。高效地執(zhí)行一個(gè)復(fù)雜的項(xiàng)目,同時(shí)進(jìn)行有效的協(xié)調(diào)和溝通,是每個(gè)數(shù)據(jù)科學(xué)家的必備要求。
一個(gè)數(shù)據(jù)科學(xué)家必須要有認(rèn)真傾聽(tīng)主管、員工和其他任何人的指示的能力。一旦聽(tīng)完,通過(guò)激烈的、有意義的、深思熟慮的交流來(lái)傳達(dá)觀點(diǎn)和想法,從而處理信息并且有效溝通,至關(guān)重要。數(shù)據(jù)科學(xué)家也需要指揮其隊(duì)友,有效地協(xié)調(diào),和組員一起完成手頭的特定任務(wù)。
團(tuán)隊(duì)協(xié)作
更多的時(shí)候,大數(shù)據(jù)科學(xué)項(xiàng)目需要一批職能明確、積極高效的數(shù)據(jù)科學(xué)家,以最高的效率執(zhí)行特定的商業(yè)風(fēng)險(xiǎn)或任務(wù)。因此,他們必須為特定項(xiàng)目制作高質(zhì)量的模型,為自己的員工提供最好的服務(wù)。
團(tuán)隊(duì)工作意義重大,因?yàn)樗枰獙?duì)正在進(jìn)行的項(xiàng)目進(jìn)行一致的信息交流。因此,這項(xiàng)工作需要數(shù)據(jù)科學(xué)家們集體努力,找出最佳的解決方案,提高模型的準(zhǔn)確性,并在部署過(guò)程中產(chǎn)生最優(yōu)質(zhì)的結(jié)果。
圖源:unsplash
毅力
對(duì)筆者來(lái)說(shuō),數(shù)據(jù)科學(xué)項(xiàng)目中最有趣的部分是建立機(jī)器學(xué)習(xí)或深度學(xué)習(xí)模型,并確保它們順利工作,從而感覺(jué)良好。一旦它們符合相應(yīng)要求,就可以部署這些已建立的模型。
然而,數(shù)據(jù)科學(xué)的很大一部分其實(shí)在于處理手頭的數(shù)據(jù)。網(wǎng)絡(luò)上自然存在的大部分?jǐn)?shù)據(jù)都不干凈。為了提取有用的數(shù)據(jù),必須進(jìn)行大量的清洗和預(yù)處理。大多數(shù)復(fù)雜的任務(wù)都需要進(jìn)行關(guān)鍵性的分析和計(jì)算處理,以獲得理想的結(jié)果。毅力在每種情況中都極為重要,在數(shù)據(jù)科學(xué)領(lǐng)域,尤為如此。
即使是這個(gè)領(lǐng)域的專(zhuān)家,他們也會(huì)犯錯(cuò),并且為了解決某些問(wèn)題而不得不查資料。這個(gè)領(lǐng)域可能是僅有的一個(gè)你不需要死記硬背很多東西的領(lǐng)域,因?yàn)槟憧梢杂霉雀鑱?lái)查找你忘記的東西。
然而,這完全沒(méi)問(wèn)題,因?yàn)樗鼉H僅是一個(gè)學(xué)習(xí)過(guò)程,堅(jiān)持到底,你才能夠成長(zhǎng)為一個(gè)更好的數(shù)據(jù)科學(xué)家。
較強(qiáng)的決策能力
處理計(jì)算任務(wù)的復(fù)雜情況并評(píng)估各種模型結(jié)果的質(zhì)量,這在行業(yè)層面極其重要。因此,必須做出強(qiáng)有力的決定,決定什么是解決當(dāng)前復(fù)雜任務(wù)的最佳選擇和最佳可用資源。
舉幾個(gè)簡(jiǎn)單的例子,假設(shè)一個(gè)機(jī)器學(xué)習(xí)任務(wù),你能夠發(fā)現(xiàn)支持向量機(jī)(SVMs)在執(zhí)行某項(xiàng)任務(wù)時(shí)的準(zhǔn)確率為97%,而像邏輯回歸這樣的機(jī)器學(xué)習(xí)算法能夠以98%的準(zhǔn)確率執(zhí)行同樣的任務(wù)。數(shù)據(jù)科學(xué)家必須能夠確定每個(gè)特定任務(wù)的最佳選擇。
將這個(gè)例子進(jìn)一步擴(kuò)展到深度學(xué)習(xí)和神經(jīng)元網(wǎng)絡(luò),數(shù)據(jù)科學(xué)家能夠相應(yīng)地在TensorFlow或Pytorch這樣的深度學(xué)習(xí)框架之間切換,以選擇最適合當(dāng)前任務(wù)的框架。
這些顯然只是一些簡(jiǎn)單的例子。然而,對(duì)于數(shù)據(jù)科學(xué)家成倍地拓展思路,獲取更佳結(jié)果來(lái)說(shuō),決策能力極為關(guān)鍵。
這五種獨(dú)特的品質(zhì)是數(shù)據(jù)科學(xué)家必備的的最基本特征。技術(shù)技能同樣是必不可少的,基礎(chǔ)知識(shí)和對(duì)該學(xué)科的深刻理解保證了真正的方法。然而,在筆者看來(lái),想要持久長(zhǎng)期的成功,這些獨(dú)特品質(zhì)才是絕對(duì)必須的。






















