一文講清:數(shù)據(jù)分析與數(shù)據(jù)挖掘到底有什么區(qū)別?
雖然崗位title里都有數(shù)據(jù)這兩個(gè)字,但這是兩條不同的發(fā)展路線,數(shù)據(jù)分析走的是業(yè)務(wù)和管理路線,數(shù)據(jù)挖掘走的是技術(shù)路線,二者有高下之分嗎?
我認(rèn)識(shí)一位年薪10萬(wàn)刀的數(shù)據(jù)分析師,只會(huì)Excel,不存在別的技能,但人家就是有能力把技術(shù)問(wèn)題轉(zhuǎn)變成業(yè)務(wù)問(wèn)題,不需要會(huì)算法和模型。
因?yàn)?ldquo;SQL+Excel+BI工具+PPT”這套組合拳,就能滿足工作中的絕大部分需求了,如果你再能用PPT把故事講漂亮,領(lǐng)導(dǎo)就覺(jué)得你很厲害了,你大搞機(jī)器學(xué)習(xí),神經(jīng)網(wǎng)絡(luò),數(shù)據(jù)算法,如果超出了領(lǐng)導(dǎo)的認(rèn)知范圍并且沒(méi)有什么好效果的話,你的背景和你的技術(shù)也就沒(méi)什么價(jià)值了。
扯遠(yuǎn)了,先來(lái)看看數(shù)據(jù)分析和數(shù)據(jù)挖掘這兩塊分別會(huì)涉及到什么。
數(shù)據(jù)分析
數(shù)據(jù)分析是比較大的概念,因?yàn)樗牧鞒淌怯珊芏鄠€(gè)部分組成的,包含了數(shù)據(jù)獲取、數(shù)據(jù)清洗、數(shù)據(jù)處理、數(shù)據(jù)分析、數(shù)據(jù)可視化等。
相比于那些長(zhǎng)篇大論的言論,基本上就是這六大塊可以完整地概括出一整個(gè)數(shù)據(jù)分析的流程,這也是數(shù)據(jù)分析概念的體現(xiàn)。
那就我個(gè)人而言,平時(shí)的數(shù)據(jù)分析工作都是在做什么?
- 從0到1搭建數(shù)據(jù)分析體系
- 數(shù)據(jù)分析工具化,產(chǎn)品化
- 支撐領(lǐng)導(dǎo)、部門決策的專題分析及業(yè)務(wù)方向探索
- 數(shù)據(jù)規(guī)范制定及提升數(shù)據(jù)質(zhì)量等基礎(chǔ)工作
可以看出,數(shù)據(jù)分析師比較看重分析策略和業(yè)務(wù)知識(shí),而這些東西,都是需要在平時(shí)的工作中,依靠項(xiàng)目經(jīng)驗(yàn)去積累,比較吃資歷、經(jīng)驗(yàn)和對(duì)業(yè)務(wù)的認(rèn)知深度。
數(shù)據(jù)挖掘
什么是數(shù)據(jù)挖掘?
專業(yè)來(lái)說(shuō),數(shù)據(jù)挖掘是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但有潛在的有用信息和知識(shí)的過(guò)程。
可以看出,數(shù)據(jù)挖掘是一個(gè)過(guò)程結(jié)果的稱謂,即主要目標(biāo)是從數(shù)據(jù)中挖取隱藏的信息。它是一個(gè)交叉科學(xué)領(lǐng)域,受多個(gè)學(xué)科影響,包括數(shù)據(jù)庫(kù)系統(tǒng)、統(tǒng)計(jì)、機(jī)器學(xué)習(xí)、可視化和信息科學(xué)。
通俗點(diǎn)解釋,數(shù)據(jù)挖掘就是透過(guò)數(shù)據(jù)的表象發(fā)現(xiàn)隱藏在背后的蛛絲馬跡,從而找到潛伏的規(guī)律以及看似無(wú)關(guān)事物之間背后的聯(lián)系,用此來(lái)洞察或預(yù)測(cè)未知事項(xiàng),輸入的是數(shù)據(jù),輸出的是知識(shí)。
都說(shuō)數(shù)據(jù)挖掘,那從哪挖掘出來(lái)?基于以下4點(diǎn):
(圖源網(wǎng)絡(luò))
數(shù)據(jù)挖掘能做到什么?我覺(jué)得舉例子更容易理解。
工廠或者制造業(yè),可以預(yù)測(cè)以后一段時(shí)間的產(chǎn)品銷量,然后來(lái)調(diào)節(jié)生產(chǎn)計(jì)劃或采購(gòu)計(jì)劃。
頭條和抖音,預(yù)測(cè)用戶會(huì)對(duì)哪個(gè)內(nèi)容感興趣,然后進(jìn)行精準(zhǔn)的推薦,這也是和算法有關(guān)。
電商,可以根據(jù)用戶購(gòu)買商品,個(gè)性化推薦其他。
券商,關(guān)聯(lián)分析用戶的數(shù)據(jù),認(rèn)定用戶的能力等級(jí)。
……
兩個(gè)崗位的對(duì)比
1、入行門檻
數(shù)據(jù)分析<數(shù)據(jù)挖掘,很多年前數(shù)據(jù)分析的門檻是很低的,但是現(xiàn)在不同了,不過(guò)比起數(shù)據(jù)挖掘所需要的背景,還是要差不少。
舉個(gè)例子,數(shù)據(jù)分析師的學(xué)歷背景:需要985211學(xué)校,有互聯(lián)網(wǎng)公司的實(shí)習(xí),最好能參與一個(gè)項(xiàng)目全程;
數(shù)據(jù)挖掘的背景:985碩士?jī)?yōu)先,要有知名互聯(lián)網(wǎng)公司項(xiàng)目經(jīng)歷,最好有從0-1的經(jīng)驗(yàn)
2、職業(yè)發(fā)展
都差不多,上面也說(shuō)了,走的是不同的路線,你在清華,我在北大,我們都有光明的未來(lái)
3、薪酬
總體上來(lái)說(shuō),數(shù)據(jù)分析<數(shù)據(jù)挖掘,畢竟對(duì)數(shù)據(jù)挖掘的技術(shù)背景要求高,當(dāng)然這只是平均薪酬,做的好的數(shù)據(jù)分析師薪酬的天花板也是高的,后續(xù)往戰(zhàn)略、管理崗發(fā)展,薪資水漲船高也是完全沒(méi)問(wèn)題。
4、跳槽含金量
看人,看項(xiàng)目。如果你只在大廠當(dāng)螺絲釘,沒(méi)業(yè)務(wù)經(jīng)驗(yàn)積累/技術(shù)沉淀,兩三年后想跳出來(lái),其實(shí)是不好跳的,因?yàn)橄胍愕墓荆憧床簧辖o開(kāi)的薪資,你想去的公司,會(huì)覺(jué)得你在大廠沒(méi)參與完整項(xiàng)目,給你的錢和你能帶來(lái)的經(jīng)濟(jì)效益不成正比,最后哪都去不了。
總結(jié)
數(shù)據(jù)分析不比數(shù)據(jù)挖掘的含金量低,職業(yè)前景也不比數(shù)據(jù)挖掘差。而數(shù)據(jù)挖掘走技術(shù)路線,競(jìng)爭(zhēng)激烈程度沒(méi)數(shù)據(jù)分析大,保住飯碗是沒(méi)問(wèn)題的。但是這些都在一個(gè)前提中:你處于數(shù)據(jù)部門,而不是業(yè)務(wù)部門,并且你的公司要重視數(shù)據(jù),你的領(lǐng)導(dǎo)能給團(tuán)隊(duì)帶來(lái)好的資源。