我是如何從會(huì)計(jì)轉(zhuǎn)行到數(shù)據(jù)分析
引言:
本文不推薦什么大社群!不推薦課程!只是簡明地描述一下我是如何轉(zhuǎn)行到數(shù)據(jù)分析崗的。
先說說自身情況吧: 16年本科畢業(yè),專業(yè)財(cái)務(wù)管理 。在家鄉(xiāng),一個(gè)二線城市,做會(huì)計(jì)做了一年多(包括實(shí)習(xí)期)。這一年多,把我從一個(gè)會(huì)計(jì)粉轉(zhuǎn)變成一個(gè)會(huì)計(jì)黑,期間的辛酸在我某個(gè)回答里有寫上一些。有轉(zhuǎn)行的念頭是16年7月,當(dāng)時(shí)就是刷刷知乎,百度一下,了解了數(shù)據(jù)分析崗的狀況,16年10月正式開始準(zhǔn)備。后來不滿意準(zhǔn)備的進(jìn)度,2017年3月提出離職申請(qǐng),待業(yè)在家學(xué)習(xí),直至8月份在廣州才拿到稍微滿意的offer。薪資確實(shí)翻了個(gè)倍還有多,但也依托于以前會(huì)計(jì)崗位的薪資實(shí)在太低太低。
16年10月,從轉(zhuǎn)行數(shù)據(jù)分析,還是考二線城市的公務(wù)員兩個(gè)選項(xiàng)中掙脫出來,最終沒聽父母的,選擇了數(shù)據(jù)分析這個(gè)無底洞。 剛開始,我是查看拉勾網(wǎng)上的公司崗位招聘要求,然后才決定我需要準(zhǔn)備什么知識(shí)。 當(dāng)時(shí)拉勾網(wǎng)的廣州數(shù)據(jù)分析師崗幾乎都被我翻完了,總結(jié)了下需要做以下幾點(diǎn)準(zhǔn)備;
- 統(tǒng)計(jì)學(xué)相關(guān)知識(shí)
- excel的熟練使用,報(bào)表關(guān)聯(lián),數(shù)據(jù)透視等。
- SQL語法,了解數(shù)據(jù)庫知識(shí)。
- python或則r,需要有建模能力。
- 業(yè)務(wù)理解能力。
- 項(xiàng)目經(jīng)驗(yàn)
1,統(tǒng)計(jì)學(xué)相關(guān)知識(shí):
先看了《商務(wù)經(jīng)濟(jì)與統(tǒng)計(jì)》第十二版,當(dāng)時(shí)看起來真的蠻吃力的,自己定的目標(biāo),比如一天看一章,根本完成不了,斷斷續(xù)續(xù)看了接近兩個(gè)月,才看到12章。也越發(fā)發(fā)現(xiàn)在職學(xué)習(xí)真的需要很大的毅力,并且上班時(shí)候總是有一個(gè)念頭:好浪費(fèi)時(shí)間啊。直到后面我又買了一本統(tǒng)計(jì)學(xué)書籍《深入淺出的統(tǒng)計(jì)學(xué)》。對(duì)比上本書,真的可讀性高很多,書里的案例很生動(dòng),里面的題目也不會(huì)太難,學(xué)起來相當(dāng)有成就感,很快就把整本書看完了。因此也愛上了這個(gè)系列的書籍,又購買了,深入淺出的數(shù)據(jù)分析和深入淺出的SQL。但發(fā)現(xiàn)這里兩本有些啰嗦,并沒有看完這兩本書。
2,excel的熟練使用,報(bào)表關(guān)聯(lián),數(shù)據(jù)透視等:
以前做財(cái)務(wù)就是一個(gè)十足的表哥,一直對(duì)excel比較有信心,所以這方面我沒有過多的復(fù)習(xí)。直到現(xiàn)在工作了,目前使用的是google.docs一個(gè)類excel工具,excel的公式也是能在這里使用,才發(fā)現(xiàn)自己的excel能力其實(shí)很弱。比如,我以前做財(cái)務(wù)寫的公式是這樣子的:
現(xiàn)在我寫的公式是這樣子的:
也是因?yàn)橐郧白鲐?cái)務(wù)的時(shí)候不用寫有關(guān)業(yè)務(wù)邏輯的公式吧。還有表和表的關(guān)聯(lián)也是個(gè)難點(diǎn)。推薦一下excel比較好的教程吧: https:// zhuanlan.zhihu.com/p/24 084300
3,SQL語法,了解數(shù)據(jù)庫知識(shí):
雖說買了深入淺出的SQL,因?yàn)橛浀卯?dāng)時(shí)已經(jīng)是我4月份了,當(dāng)時(shí)定目標(biāo)是5月找到工作(雖然***8月才找到orz),所以覺得看書太耗費(fèi)時(shí)間了,直接看的是w3c的sql教程: http://www. w3school.com.cn/sql/ ??赐旰笾苯觿?dòng)手做面試題: http:// blog.csdn.net/qaz13177_ 58_/article/details/5575711/ 。還要了解下SQL語法的順序(很重要!)然后面試SQL的筆試題基本沒啥問題了。反正面試時(shí)的筆試,印象中都會(huì)做。還有數(shù)據(jù)庫的知識(shí)推薦很多人推薦的一本:《MYSQL必知必會(huì)》吧(然而我并沒準(zhǔn)備這方面知識(shí),好像也不太影響。)
4,python或則r,需要有建模能力:
python和r,我選了python。單純覺得python好聽!面試了16家,其中只有3家公司是真正要求需要用到python或則r進(jìn)行數(shù)據(jù)分析的,所以覺得這兩門語言并不是必備項(xiàng)。當(dāng)時(shí)看的書籍是pandas作者寫的《利用python進(jìn)行數(shù)據(jù)分析》至今工作后仍在溫習(xí),跟著代碼打一遍,受益匪淺。
還有建模知識(shí): 現(xiàn)在我越發(fā)懷疑數(shù)據(jù)分析所說的建模只是類似“漏斗模型”等等的業(yè)務(wù)模型,并非機(jī)器學(xué)習(xí)模型。 因?yàn)閿?shù)據(jù)分析崗必須用到機(jī)器學(xué)習(xí)模型的崗位幾乎沒有。只是你懂機(jī)器學(xué)習(xí)是一個(gè)加分項(xiàng),工作時(shí)多一個(gè)技術(shù)層面分析數(shù)據(jù)而已。不過當(dāng)時(shí)的我并不知道這些啊,傻傻的也準(zhǔn)備機(jī)器學(xué)習(xí)來;首推當(dāng)然是吳恩達(dá)老師在coursea的課程《Machine Learning》然后是周志華老師的西瓜書(我只看了一點(diǎn)點(diǎn)。)當(dāng)時(shí)接觸了這些,我感覺機(jī)器學(xué)習(xí)好難好難,根本不可能在兩三個(gè)月內(nèi)了解完常用模型的原理。后來我就用野路子了:不去了解原理,只是去用機(jī)器學(xué)習(xí)python的包:sklearn!,至少我能用模型。Sklearn的學(xué)習(xí)當(dāng)然是 http:// scikit-learn.org/stable /index.html
Sklearn的官方文檔,寫的很詳細(xì),也會(huì)推薦文獻(xiàn)去讓你學(xué)習(xí)原理,雖說是英文的,但你可以和我一樣用谷歌瀏覽器把它翻譯呀!
5,業(yè)務(wù)理解能力:
- 數(shù)據(jù)分析中的重中之重!無奈這方面實(shí)在沒有很好的學(xué)習(xí)途徑,結(jié)合自身面試的經(jīng)歷給大家一些小Tips吧。
- 做面試準(zhǔn)備時(shí),一定要去了解該公司的有哪些數(shù)據(jù)指標(biāo)?這些指標(biāo)是如何計(jì)算的?如何提高的?比如電商:如何提高復(fù)購率?或則運(yùn)營的:有哪些常用的數(shù)據(jù)指標(biāo)?答: https:// zhuanlan.zhihu.com/p/27 029515
- 需要了解一些流量統(tǒng)計(jì)的常用工具: Google Analytics;百度統(tǒng)計(jì);百度指數(shù)等。
- 要會(huì)畫思維導(dǎo)圖,面試時(shí)有一道題印象很深:用思維導(dǎo)圖預(yù)測(cè)廣州10年后人口數(shù)量。
- 可以學(xué)學(xué)爬蟲工具,面試時(shí)有被經(jīng)常問到這樣的問題:“你會(huì)用python?那你能幫我爬競爭對(duì)手的數(shù)據(jù)嗎”。我:”…………………………….只會(huì)數(shù)據(jù)分析的常用庫。”后來了解了幾款爬蟲工具,暫時(shí)已經(jīng)能滿足我爬數(shù)據(jù)的需求,不過我后續(xù)仍會(huì)去學(xué)習(xí)python爬蟲的知識(shí)。
6,項(xiàng)目經(jīng)驗(yàn):
沒有項(xiàng)目,憑什么一個(gè)轉(zhuǎn)行人士說你懂?dāng)?shù)據(jù)分析?所以,我乖乖的去做項(xiàng)目了??赡苣阌X得一個(gè)轉(zhuǎn)行人士哪有項(xiàng)目啊?實(shí)際上,想要有項(xiàng)目經(jīng)驗(yàn),真不難!我總結(jié)了有以下途徑:
- 在網(wǎng)上下載數(shù)據(jù)進(jìn)行分析: http://www. moojnn.com/data-market/ 篩選免費(fèi)的數(shù)據(jù)就好!
- 自己爬數(shù)據(jù)進(jìn)行分析,這就需要用到爬蟲工具了(百度一搜很多的)。我復(fù)試時(shí)候爬了競爭對(duì)手的數(shù)據(jù)去預(yù)測(cè)價(jià)格,然后,我拿到的offer。
- 做比賽,類似于kaggle,天池,數(shù)據(jù)城堡等等都有算法競賽。我自己是選了這條路,但是這需要機(jī)器學(xué)習(xí)的知識(shí)。
除了面試的準(zhǔn)備,還想提醒大家需要避免的幾個(gè)誤區(qū):
在知乎的數(shù)據(jù)分析版塊已逛好久,越發(fā)覺得這版塊營銷味濃厚,也請(qǐng)大家?guī)е鴳岩傻膽B(tài)度去看。有些營銷味濃厚到已經(jīng)影響我觀看知乎的體驗(yàn)了。
為此,也和大家分享下零基礎(chǔ)轉(zhuǎn)行需要注意的幾個(gè)誤區(qū),畢竟我(文科生)也是零基礎(chǔ)過來的,說說我覺得有幾個(gè)必須要注意的誤區(qū)吧。
1, 數(shù)據(jù)分析崗大多數(shù)用不到python與r!機(jī)器學(xué)習(xí)更是用不到!
以我目前的工作為例,我用到的工具是google.docs(類excel工具),和ppt.word.sql等等。而python和r是非必要工具,感覺像是簡歷中的加分項(xiàng),當(dāng)然我也認(rèn)為數(shù)據(jù)分析需要必備掌握其的中一門,但是這并非求職中的必備項(xiàng)。機(jī)器學(xué)習(xí)就更不用說了,還是先理清自身公司數(shù)據(jù)的異常值,數(shù)據(jù)準(zhǔn)確度,數(shù)據(jù)指標(biāo)的邏輯等等吧。亂臟數(shù)據(jù)都沒理清,談何建模。若你想快速進(jìn)入數(shù)據(jù)分析崗,python和r可以入崗之后學(xué),專心做一兩個(gè)項(xiàng)目出來才是關(guān)鍵!
2, 認(rèn)為數(shù)據(jù)分析崗普遍工資很高!
在知乎文章看多了,覺得轉(zhuǎn)行就有9K上萬,現(xiàn)在想想也是醉了,感覺做到這個(gè)數(shù)字的人。應(yīng)該有他的原因,但我認(rèn)為如果條件和我相差不遠(yuǎn)的話,很難做到。在廣州面試了兩個(gè)禮拜,拿到的offer的工資都在4.5~6之間!然而這些崗位的招聘條件幾乎都是6-1w。印象最深的是有個(gè)做郵件推廣的公司,招聘時(shí)寫著7.5-1.2,去到只有3.5(黑人問號(hào)??。雖說拿到不少面試邀請(qǐng)(16個(gè)拿了8個(gè)offer,都是小公司)但滿意的真的很少很少,***找到心灰意冷的時(shí)候,終于拿到一個(gè)算是滿意的offer。而我最滿意的三個(gè)數(shù)據(jù)咨詢公司都沒有給我復(fù)試的機(jī)會(huì)。想起還有些難受。
3, 誤認(rèn)為數(shù)據(jù)挖掘崗就是數(shù)據(jù)分析崗!
面試時(shí)候就能強(qiáng)烈的感受到這兩者的區(qū)別。
一般數(shù)據(jù)分析崗,招聘標(biāo)題為:
- 數(shù)據(jù)運(yùn)營。
- 數(shù)據(jù)分析師。
- 數(shù)據(jù)分析專員。
- 數(shù)據(jù)產(chǎn)品經(jīng)理。等等
而招聘數(shù)據(jù)挖掘,標(biāo)題:數(shù)據(jù)挖掘工程師。(算法工程師不算)
其中里面的要求更是十分不同,數(shù)據(jù)分析崗會(huì)偏向?qū)I(yè)務(wù)的理解,學(xué)歷大專往上。工具除了excel和sql,也會(huì)包括一些流量統(tǒng)計(jì)的工具,比如google analytics,百度統(tǒng)計(jì),百度指數(shù)等。對(duì)編程要求比較少,只是加分項(xiàng)。數(shù)據(jù)挖掘崗,除業(yè)務(wù)理解對(duì)編程也有一定要求。機(jī)器學(xué)習(xí)必須了解,對(duì)工作經(jīng)驗(yàn)也有要求。可以往下看我簡歷中的技能要求。我學(xué)習(xí)了python和機(jī)器學(xué)習(xí)并參加的算法比賽,這使我偏向數(shù)據(jù)挖掘方向,但我又不夠資格得到數(shù)據(jù)挖掘崗的offer,只能找數(shù)據(jù)分析崗,那種低不成高不就的感覺,很是尷尬。
想說的都快說完了,感覺說了很多,又感覺沒說什么,總感覺有一句很重要的沒說,想了很久,終于想起,轉(zhuǎn)行數(shù)據(jù)分析前,還是先問問自己一個(gè)問題: “喜歡對(duì)著數(shù)據(jù)嗎?” 回答Yes的話,來不及解釋了,數(shù)據(jù)的“火”車還沒走,快上車!