一套通用的數(shù)據(jù)分析學(xué)習(xí)指南,入門必看!
最近收到了不少朋友的問題:我是做運(yùn)營的想入門數(shù)據(jù)分析應(yīng)該怎么學(xué)?新手做數(shù)據(jù)分析有哪些好用的工具?會用Excel但是做分析總是沒思路怎么辦?做數(shù)據(jù)分析有哪些方法等等一系列的問題,今天我就用這篇文章統(tǒng)一回答關(guān)于數(shù)據(jù)分析入門的問題。
數(shù)據(jù)分析是什么?
很多人都沒有搞懂?dāng)?shù)據(jù)分析是什么,包括一些公司和企業(yè)也沒搞清楚數(shù)據(jù)分析的定義。經(jīng)常聽到有人說投了數(shù)據(jù)分析的崗位,結(jié)果入職之后每天干的活就是取數(shù)給業(yè)務(wù)用,感覺自己就像個(gè)取數(shù)機(jī)。這樣的工作根本不能叫做數(shù)據(jù)分析。
什么是數(shù)據(jù)分析,用我自己的話來說就是針對某個(gè)問題,將獲取后的數(shù)據(jù)用分析手段加以處理,并發(fā)現(xiàn)業(yè)務(wù)價(jià)值的過程。這一句話也基本涵蓋了數(shù)據(jù)分析的流程:目標(biāo)確定——數(shù)據(jù)獲取、清洗、整理——數(shù)據(jù)分析——結(jié)果呈現(xiàn)
數(shù)據(jù)分析需要哪些能力
數(shù)據(jù)分析師需要會哪些技能,圍繞上面數(shù)據(jù)分析的基本流程,我把數(shù)據(jù)分析師的能力分為這樣三大部分:基礎(chǔ)知識、工具技能、分析方法與思維
以下師數(shù)據(jù)分析的技能大綱,圖中標(biāo)記了能力等級,大家根據(jù)自己的情況對應(yīng)學(xué)習(xí):
數(shù)據(jù)分析基礎(chǔ)知識
數(shù)據(jù)分析理論知識這方面,需要掌握是統(tǒng)計(jì)學(xué)和機(jī)器學(xué)習(xí)相關(guān)知識。
1、統(tǒng)計(jì)學(xué)
毫不夸張的說統(tǒng)計(jì)學(xué)是整個(gè)數(shù)據(jù)分析的靈魂。判別一個(gè)數(shù)據(jù)分析師強(qiáng)弱的一個(gè)重要方法就是,看他對統(tǒng)計(jì)規(guī)律的敏感度。這里我們需要從基礎(chǔ)的統(tǒng)計(jì)理論(描述性統(tǒng)計(jì)、區(qū)間估計(jì)、假設(shè)檢驗(yàn)等)出發(fā),到基本的統(tǒng)計(jì)分析(T 檢驗(yàn)、方差分析等),最后到商業(yè)常用的模型(回歸分析、方差分析等),學(xué)習(xí)數(shù)據(jù)分析背后的邏輯,掌握實(shí)用統(tǒng)計(jì)學(xué)的概念和會利用統(tǒng)計(jì)的思維去思考問題。推薦書籍:《深入淺出數(shù)據(jù)分析》、《統(tǒng)計(jì)學(xué)習(xí)方法》李航
《深入淺出數(shù)據(jù)分析》這本書非常推薦作為小白的入門書籍,特別是之前沒有接觸過數(shù)據(jù)分析的。特點(diǎn)和書名一樣深入淺出,而且圖多。里面沒有那么多公式和理論,但其中對于統(tǒng)計(jì)的基本原理以及統(tǒng)計(jì)問題的來源場景介紹的非常通透,非常符合深入淺出系列定位。如果有之前有一定基礎(chǔ),建議略過。
2、機(jī)器學(xué)習(xí)
對于想要進(jìn)階成為高級數(shù)據(jù)分析師的朋友來說,就要掌握機(jī)器學(xué)習(xí)相關(guān)的知識:特征工程的基礎(chǔ):如何統(tǒng)計(jì)數(shù)據(jù)特征、選用不同的特征,做模型的優(yōu)化;基本的分類算法:決策樹、隨機(jī)森林等;基本的聚類算法、數(shù)據(jù)挖掘、常見的機(jī)器學(xué)習(xí)算法的了解等等機(jī)器學(xué)習(xí)相關(guān)的知識學(xué)習(xí)成本會比較高,對某些同學(xué)來說可能會有一定難度,但對于業(yè)務(wù)型數(shù)據(jù)分析師來說,一般不會要求你去推導(dǎo)算法公式,能做到明白不同算法的適用場景、優(yōu)缺點(diǎn)、原理大概懂就基本可以了。推薦學(xué)習(xí)書籍:《機(jī)器學(xué)習(xí)》周志華,網(wǎng)上也有不少學(xué)習(xí)視頻,入門的話我推薦吳恩達(dá)的coursera機(jī)器學(xué)習(xí)課
數(shù)據(jù)分析工具學(xué)習(xí)
1、PPT
為什么把PPT放在第一,原因很簡單,我們做數(shù)據(jù)分析的目的是什么?當(dāng)然是為了展示給客戶、上級,供他們做決策。所以PPT作為主流匯報(bào)、展示工具,是將分析關(guān)鍵結(jié)果傳遞給其他的重要手段。學(xué)好PPT可以提升溝通和消息傳遞效率,也是數(shù)據(jù)分析師必備的技能,具體學(xué)習(xí)書目我就不做推薦了。
2、EXCEL
EXCEL應(yīng)該是數(shù)據(jù)分析師最常用的統(tǒng)計(jì)分析工具了,原因是因?yàn)榉奖?,所見即所得,而且具有方便的可視化功能。?yīng)該說只有學(xué)會了Vlookup,數(shù)據(jù)透視和基本公式才算EXCEL入門,其次EXCEL最大的驚喜是數(shù)據(jù)可視化,擁有大量的圖表模板,可以減輕我們很多工作。這里我推薦《誰說菜鳥不會數(shù)據(jù)分析》這本書作為EXCEL入門。這本書如果作為數(shù)據(jù)分析入門書籍是不合格的,因?yàn)樗刑鄡?nèi)容是關(guān)于EXCEL基本操作的,關(guān)于數(shù)據(jù)分析的內(nèi)容反而很少,但是實(shí)事求是的講這本書里面關(guān)于EXCEL數(shù)據(jù)分析常用公式、數(shù)據(jù)可視化的內(nèi)容還是不錯(cuò)的,可以當(dāng)成一本入門書籍。
3、ACCESS
為什么把ACCESS作為中級數(shù)據(jù)分析師必備技能,原因很簡單,當(dāng)數(shù)據(jù)太大,EXCEL又處理不了,又沒有很強(qiáng)的編程基礎(chǔ)怎么辦?ACCESS的優(yōu)勢就體現(xiàn)出來了,它可以在不用掌握很高深編程語言的條件下,處理Excel所不能承載的大存儲量的數(shù)據(jù)原始文件,速度奇快,且易學(xué)易用。作為入門,我推薦《表哥的Access入門》這本書。通過一個(gè)簡單的小飯館數(shù)據(jù)庫管理程序的開發(fā)過程,對理解數(shù)據(jù)庫和學(xué)習(xí)一些基本的ACCESS很有幫助。
4、SQL
作為數(shù)據(jù)分析人員,要想獲取數(shù)據(jù),肯定就要和數(shù)據(jù)庫打交道,因此sql肯定是要掌握的,在招聘要求中,sql也是很多數(shù)據(jù)分析崗位的能力要求之一。學(xué)習(xí)SQL最快的方法是能自己下載數(shù)據(jù)庫管理工具,找些數(shù)據(jù)練習(xí),主要了解一些數(shù)據(jù)庫查詢語言,where,group by,orderby,having,like,count,sum,min,max,distinct,if,join,left join,limit,and和or的邏輯,時(shí)間轉(zhuǎn)換函數(shù)等。這里推薦《MYSQL必知必會》
5、Python
Python作為目前最火的編程軟件之一,確實(shí)在數(shù)據(jù)分析、數(shù)據(jù)挖掘上有著獨(dú)特優(yōu)勢。是否具備編程能力,也是初級數(shù)據(jù)分析和高級數(shù)據(jù)分析的分水嶺。以下以python的學(xué)習(xí)路線圖:
看起來要學(xué)習(xí)的內(nèi)容挺多的,但其實(shí)python最大的優(yōu)勢就是語言簡約,非常易于讀寫,如果之前有一定的編程基礎(chǔ),上手很快。推薦書籍《Python編程快速上手》,新手可以跟著書里的內(nèi)容一步步做,把里面的項(xiàng)目做完,差不多就入門了
6、商業(yè)數(shù)據(jù)分析軟件
excel做數(shù)據(jù)分析難以解決大數(shù)據(jù)量的問題,對沒有編程基礎(chǔ)的人來說上手python又比較難,這時(shí)候可以選擇利用數(shù)據(jù)分析軟件來做數(shù)據(jù)分析,現(xiàn)在市場上的數(shù)據(jù)分析軟件基本都涵蓋來數(shù)據(jù)采集、處理、分析到可視化展現(xiàn)的過程,操作簡單,可視化效果很棒,比較適合新手入門。比較好用的有FineBI、tableau 等等
數(shù)據(jù)分析方法
學(xué)習(xí)數(shù)據(jù)分析肯定有人上網(wǎng)百度了不少數(shù)據(jù)分析方法,什么漏斗分析法,PEST,SWOT模型、杜邦分析法等等。并且由于不同版本的演繹,造成了分析方法種類繁多,令人眼花繚亂,關(guān)于分析方法值得一說的就是一定要結(jié)合行業(yè)特點(diǎn),特別是對業(yè)務(wù)的掌握,這樣才能事半功倍。下面簡單列幾個(gè)比較通用的分析方法:
1、對比分析法
對比分析法常用的基礎(chǔ)分析方法,雖然方法特別簡單,但幾乎所有的分析報(bào)告中,都會采取對比分析方法。比如去年同期相比、上個(gè)月環(huán)比、目標(biāo)和實(shí)際達(dá)成相比、各個(gè)部門和業(yè)務(wù)線相比、行業(yè)內(nèi)競品比較、營銷效果對比,等等。這里需要注意的是我們不管是橫向比較還是縱向比較,比較的雙方一定要有可比性,并且在同一個(gè)維度、粒度上去比較,要不是毫無意義的。
2、5W2H分析法
這個(gè)方法主要應(yīng)用于用戶行為研究和專項(xiàng)問題分析,從時(shí)間、地點(diǎn)、人物、事情、原因、方式、價(jià)格等7個(gè)方面對一個(gè)問題進(jìn)行刻畫研究。
3、SWOT
明確資源優(yōu)勢(Strengths)、競爭劣勢(Weaknesses)、外部環(huán)境變化帶來的機(jī)會(Opportunities)和威脅(Threats)等,將這些因素有機(jī)結(jié)合起來,以此確定企業(yè)經(jīng)營戰(zhàn)略。
4、PEST
從政治(Politics)、經(jīng)濟(jì)(Economics)、社會(Society)、技術(shù)(Technology)4個(gè)視角分析外部環(huán)境。
5、杜邦分析法
杜邦分析法是一種用來評價(jià)公司盈利能力和股東權(quán)益回報(bào)水平,從財(cái)務(wù)角度評價(jià)企業(yè)績效的一種經(jīng)典方法。其基本思想是將企業(yè)凈資產(chǎn)收益率逐級分解為多項(xiàng)財(cái)務(wù)比率乘積,這樣有助于深入分析比較企業(yè)經(jīng)營業(yè)績。
數(shù)據(jù)分析思維
分析思維是數(shù)據(jù)分析師最最核心的競爭力,上面所學(xué)習(xí)的python、sql、機(jī)器學(xué)習(xí)知識等都是在工具層面,要想使用好他們,還需要分析思維的駕馭。對于分析思維的學(xué)習(xí),我建議新人也是從讀書開始,我看過的且比較推薦的書包括:
數(shù)據(jù)分析類《精益數(shù)據(jù)分析》、《增長黑客》、《數(shù)據(jù)化管理:洞悉零售及電子商務(wù)運(yùn)營》、《數(shù)據(jù)挖掘與數(shù)據(jù)化運(yùn)營實(shí)戰(zhàn) 思路、方法、技巧與應(yīng)用》
產(chǎn)品思維類如果是想要從事互聯(lián)網(wǎng)行業(yè)的數(shù)據(jù)分析師的話,產(chǎn)品思維也是必須要具備的,面試考察點(diǎn)之一,推薦《從點(diǎn)子到產(chǎn)品:產(chǎn)品經(jīng)理的價(jià)值觀與方法論》、《俞軍產(chǎn)品方法論》、《產(chǎn)品思維》
邏輯思維類在面試中邏輯清晰的回答面試官的問題,會為你大大的加分,推薦《金字塔原理》、《學(xué)會提問》、《麥肯錫思維》
本文轉(zhuǎn)載自微信公眾號「數(shù)據(jù)分析不是個(gè)事兒」