收藏!一文掌握數(shù)據(jù)分析知識體系
什么是數(shù)據(jù)分析?需要掌握哪些技能?如何進行數(shù)據(jù)分析?本文全面梳理了數(shù)據(jù)分析知識體系,從數(shù)據(jù)分析的定義講起,詳細介紹了分析思維模型和經(jīng)典分析模型及指標體系。
一 數(shù)據(jù)分析定義
數(shù)據(jù)分析是指有針對性的收集、加工、整理數(shù)據(jù),并采用統(tǒng)計、挖掘技術分析和解釋數(shù)據(jù)。數(shù)據(jù)分析是為了提取有用信息和形成結論而對數(shù)據(jù)加以詳細研究和概括總結的過程。
1 數(shù)據(jù)定義
數(shù)據(jù)是客觀事實,對于客觀事物發(fā)生,發(fā)展的數(shù)字化記錄。隨著科學技術的發(fā)展,數(shù)據(jù)的概念內涵越來越廣泛包括數(shù)值,文本,聲音,圖像,視頻。
數(shù)據(jù)可以分為定性數(shù)據(jù)和定量數(shù)據(jù)。
- 定性數(shù)據(jù)是用來描述事物的屬性,名稱等,它一種標志,沒有序次關系。例如,“性別”,“男”編碼為1,“女”編碼為2。
- 定量數(shù)據(jù)描述量化屬性,或用于編碼。如交易金額、額度、商品數(shù)量、積分數(shù)、客戶評分等都屬于量化屬性。
定量數(shù)據(jù)可以繼續(xù)劃分:定序數(shù)據(jù)、定距數(shù)據(jù)與定比數(shù)據(jù)。
- 定序數(shù)據(jù)(Ordinal):數(shù)據(jù)的中間級,用數(shù)字表示個體在某個有序狀態(tài)中所處的位置,不能做四則運算。例如,“受教育程度”,文盲半文盲=1,小學=2,初中=3,高中=4,大學=5,碩士研究生=6,博士及其以上=7。
- 定距數(shù)據(jù)(Interval):具有間距特征的變量,有單位,沒有絕對零點,可以做加減運算,不能做乘除運算。例如,溫度。
- 定比變量(Ratio):數(shù)據(jù)的最高級,既有測量單位,也有絕對零點,例如職工人數(shù),身高。
2 數(shù)據(jù)分析大事記
計算機時代崛起
計算機的發(fā)展和計算技術的發(fā)展極大地增強了數(shù)據(jù)分析的過程。1880年,在使用計算機之前,美國人口普查局花了7年的時間來處理收集到的信息并完成最終報告。使用此設備,在18個月內完成了1890年的人口普查。
關系數(shù)據(jù)庫誕生
關系數(shù)據(jù)庫由埃德加·科德(Edgar F. Codd)在1970年代發(fā)明,并在1980年代非常流行。關系數(shù)據(jù)庫(RDBM)允許用戶編寫Sequel(SQL)并從其數(shù)據(jù)庫中檢索數(shù)據(jù)。關系數(shù)據(jù)庫和SQL提供了能夠按需分析數(shù)據(jù)的優(yōu)勢,并且仍在廣泛使用。它們易于使用,對于維護準確的記錄非常有用。
數(shù)據(jù)倉庫誕生
在1980年代后期,收集數(shù)據(jù)的數(shù)量繼續(xù)顯著增長,部分原因是硬盤驅動器的成本較低。在此期間,開發(fā)了數(shù)據(jù)倉庫的體系結構,以幫助將來自操作系統(tǒng)的數(shù)據(jù)轉換為決策支持系統(tǒng)。數(shù)據(jù)倉庫通常是云的一部分,或者是組織的大型機服務器的一部分。與關系數(shù)據(jù)庫不同,數(shù)據(jù)倉庫通常經(jīng)過優(yōu)化,可快速響應查詢。
商業(yè)智能(BI)崛起
20世紀80年代-90年代,數(shù)十家BI廠商進入市場。數(shù)據(jù)倉庫技術的發(fā)展大大推動了商業(yè)智能的發(fā)展,傳統(tǒng)存儲在各個地方的業(yè)務數(shù)據(jù)開始集中在一起。應運而生的技術還包括ETL(數(shù)據(jù)抽取、轉換、加載)和OLAP(聯(lián)機分析處理)。
數(shù)據(jù)挖掘崛起
數(shù)據(jù)挖掘始于1990年代,是在當時多個學科發(fā)展的基礎上發(fā)展起來的。隨著數(shù)據(jù)庫技術的發(fā)展應用,數(shù)據(jù)的積累不斷膨脹,導致簡單的查詢和統(tǒng)計已經(jīng)無法滿足企業(yè)的商業(yè)需求,急需一些革命性的技術去挖掘數(shù)據(jù)背后的信息。
大數(shù)據(jù)來臨
2000年到2010年是大數(shù)據(jù)興起和備受關注的時期,谷歌的“三駕馬車”:谷歌文件系統(tǒng)、MapReduce和 BigTable。亞馬遜也發(fā)表了一篇關于 Dynamo系統(tǒng)的論文。這幾篇論文奠定了大數(shù)據(jù)時代的基礎。隨著大數(shù)據(jù)的到來,海量的數(shù)據(jù)以及新的技術發(fā)展,幫助公司將數(shù)據(jù)轉化為洞察力。
數(shù)據(jù)科學家
2012年9月, Tom Davenport和DJ Patil 在《哈佛商業(yè)評論》上發(fā)表了“數(shù)據(jù)科學家:21世紀最性感的工作” 。
增強分析
2017年,Rita Sallman,Cindi Howson和Carlie Idonies在Gartner的研究論文中引入了增強分析的概念,并將其描述為一種新的數(shù)據(jù)分析方法,可使用機器學習和自然語言生成(NLG)自動化見解。增強型數(shù)據(jù)分析大大提升了數(shù)據(jù)分析效率,降低數(shù)據(jù)分析的門檻,人人都可以像數(shù)據(jù)科學家一樣,對數(shù)據(jù)進行多維度的自動鉆取,自動加載各種模型進行深度分析。
3 數(shù)據(jù)分析 VS 數(shù)據(jù)科學 VS 商業(yè)智能
商業(yè)智能(Business intelligence )
泛指用于業(yè)務分析的技術和工具,通過獲取、處理原始數(shù)據(jù),將其轉化為有價值的信息指導商業(yè)行動。維基百科定義為一個組織將所有資源轉化為認知的能力。
數(shù)據(jù)科學(data science)
是一個多學科領域,專注于從大量原始和結構化數(shù)據(jù)中找到切實可行的見解。該領域主要注重發(fā)掘我們沒有意識到我們還不清楚的事情的答案。它結合了諸多領域中的理論和技術,包括應用數(shù)學、統(tǒng)計、模式識別、機器學習、數(shù)據(jù)可視化、數(shù)據(jù)倉庫以及高性能計算。數(shù)據(jù)科學通過運用各種相關的數(shù)據(jù)來幫助非專業(yè)人士理解問題。
三者關系
- 數(shù)據(jù)分析是一個相當廣的領域,其中包含了數(shù)據(jù)科學。數(shù)據(jù)科學是最近比較火的一個名詞,與傳統(tǒng)的數(shù)據(jù)分析相比都是從數(shù)據(jù)中找到知識和見解,只是在使用的技能和方式下有一定差異。
- 并不是所有的數(shù)據(jù)分析都是商業(yè)的,所以他們兩有一個定的交集。
- 有的數(shù)據(jù)科學過程并不直接是商業(yè)分析,但卻是數(shù)據(jù)分析。比如在石油行業(yè)中“鉆井作業(yè)優(yōu)化”需要數(shù)據(jù)科學工具和技術,屬于數(shù)據(jù)科學家的日常工作。但是,我們不能將其和商業(yè)分析關聯(lián)起來。
4 數(shù)據(jù)分析師 vs 數(shù)據(jù)科學家
雖然數(shù)據(jù)分析師和數(shù)據(jù)科學家都與數(shù)據(jù)打交道,但主要的區(qū)別在于他們如何處理數(shù)據(jù)。數(shù)據(jù)分析師檢查大型數(shù)據(jù)集,以確定趨勢、開發(fā)圖表和創(chuàng)建可視化表示,以幫助企業(yè)做出更多的戰(zhàn)略決策。另一方面,數(shù)據(jù)科學家使用原型、算法、預測模型和自定義分析設計和構建新的數(shù)據(jù)建模和生產(chǎn)流程。
數(shù)據(jù)科學家、數(shù)據(jù)工程師和軟件工程師技能圖譜:
二 為什么要分析
分析的本質是讓業(yè)務更加清晰,讓決策更加高效。在市場經(jīng)濟的條件下,企業(yè)面對激烈的競爭,差異化的市場,多變的環(huán)境,常常會面臨各種難題。數(shù)據(jù)分析是用來解決企業(yè)的難題,識別機會,規(guī)避風險,問題診斷。
總結下來,數(shù)據(jù)分析可以幫助我們:
- 發(fā)生了什么:追溯過去,了解真相。
- 為什么發(fā)生:洞察事務發(fā)生的本質,尋找根源。
- 未來可能發(fā)生什么:掌握事務發(fā)展的規(guī)律,預測未來。
- 我們該怎么做:基于你已經(jīng)知道的“發(fā)生了什么”、“為什么會發(fā)生”以及“未來可能發(fā)生什么”的分析,幫助你確定可以采取的措施,也就是:驅動行動。
三 如何分析?
分析的6個步驟:
1 明確分析目的
業(yè)務理解
從事數(shù)據(jù)分析工作的前提就是懂業(yè)務,即熟悉行業(yè)知識、公司業(yè)務及流程,有自己的業(yè)務見解。如果脫離行業(yè)認知和公司業(yè)務背景,分析的結果沒有太大的使用價值。
如何做到懂業(yè)務?首先我們要明白我們業(yè)務的商業(yè)模式是怎么樣的?即我們通過什么樣的方式發(fā)生關系并最終產(chǎn)生什么樣的商業(yè)價值。其次我們要了解我們商業(yè)模式的核心組成要素,例如我們的客戶細分、收入來源、關鍵業(yè)務、核心的資源、成本的結構等等。除此之外我們要對核心的環(huán)境因素有所了解,例如宏觀經(jīng)濟、市場影響、行業(yè)趨勢等等。
明確目的
數(shù)據(jù)分析第一步,不是分析數(shù)據(jù)而是把業(yè)務的問題或者目標定義清晰。通過這次數(shù)據(jù)分析想要解決一個什么樣的問題,達成一個業(yè)務目標是什么?
業(yè)務理解 | 業(yè)務結果 |
業(yè)務目標/問題 | 結果性目標 |
2 確定分析思路和框架
在明確分析的目的之后,我們需要梳理分析思路,并確定分析框架,即從哪些角度進行分析,采用哪些分析指標。在梳理分析思路的時候,將常見的思維模型應用與分析,能夠幫我們更加清晰的理解背后的邏輯線索,做到”不重不漏“(MECE)。常見的思維模型有:結構化思維模型、時間模型、邏輯演繹模型、重要性思維模型。
當然在今天,除了思維模型,其實我們已經(jīng)沉淀了很多經(jīng)典的分析模型,這些分析模型歷經(jīng)隨便的沉淀和檢驗。如果你熟悉這些分析框架你的思考會更加快速,有效。你不需要在另起爐灶,就能達到事半功倍。例如:SWOT分析模型、STP分析模型、RATER指數(shù)模型。
掌握分析思維模型
思維模型就是我們對客觀世界的一種主觀抽象描述,通過思維模型來分析問題,從而更為準確地找到解決問題的方法。查理·芒格說過:“思維模型是你大腦中做決策的工具箱。你的工具箱越多,你就越能做出最正確的決策。”
1)結構化模型
以事物的結構為思考對象,來引導思維、表達和解決問題的一種思考方法。例如麥肯錫的金字塔原理,5W2H七要素分析法。
a)5W2H分析法
又叫七問分析法,是二戰(zhàn)中美國陸軍兵器修理部首創(chuàng)。簡單、方便,易于理解、使用,富有啟發(fā)意義,廣泛用于企業(yè)管理和技術活動,對于決策和執(zhí)行性的活動措施也非常有幫助,也有助于彌補考慮問題的疏漏。
b)結構化思維
是指一個人在面對工作任務或者難題時能從多個側面進行思考,深刻分析導致 問題出現(xiàn)的原因,系統(tǒng)制定行動方案,并采取恰當?shù)氖侄问构ぷ鞯靡愿咝书_展,取得高績效。
c)MECE原則
MECE,是Mutually Exclusive Collectively Exhaustive,中文意思是“相互獨立,完全窮盡”。也就是對于一個重大的議題,能夠做到不重疊、不遺漏的分類,而且能夠借此有效把握問題的核心,并解決問題的方法。
2)時間模型
按照事物發(fā)展的時間線索,來進行分析。例如用戶行為5階段模型:需求的產(chǎn)生->信息收集->方案比較->購買決策->購買行為。
3)邏輯演繹模型
演繹模型分為:
- 三段標準式演繹形式:大前提,小前提,結論。
- 常見4W模式:描述現(xiàn)象、分析原因、判斷趨勢、提出對策。
a)麥肯錫七步分析法
麥肯錫七步分析法又稱“七步分析法”是麥肯錫公司根據(jù)他們做過的大量案例,總結出的一套對商業(yè)機遇的分析方法。它是一種在實際運用中,對新創(chuàng)公司及成熟公司都很重要的思維、工作方法。
b)邏輯樹分析法
邏輯樹是將問題的所有子問題分層羅列,從最高層開始,并逐步向下擴展。
4)重要性思維
企業(yè)資源是有限的,需要把資源用在刀刃上。消費者的關注點有優(yōu)先級,做好消費者關注的才能打動消費者。例如,四象限分析法提倡人們應有重點地把主要的精力和時間集中地放在處理那些重要但不緊急的工作上,這樣可以做到未雨綢繆,防患于未然。
5)經(jīng)典思維模型
- 德爾菲法:一種高效重要的判斷預測工具
- 六頂思考帽:有效實用的決策與溝通工具
- KT決策法:最負盛名的決策模型
- 頭腦風暴法:激發(fā)團隊創(chuàng)新的有效決策工具
- 垃圾桶模型:一種企業(yè)內部的決策制定模式
- 5W2H分析法:一種調查研究和思考問題的有效辦法
- 決策樹分析法:現(xiàn)代管理決策者常用的有效工具
- 綜攝法:開發(fā)潛在創(chuàng)造力的一種創(chuàng)新方法
- 戈登法:適用自由聯(lián)想的技術創(chuàng)新技法
- 奧斯本檢核表法:創(chuàng)造技法之母,最著名、最典型的檢核提問型創(chuàng)新法
- 黃金思維圈法則
- STAR原則
掌握經(jīng)典分析模型
分析模型是對客觀事物或現(xiàn)象的一種描述。為了分析其相互作用機制,揭示內部規(guī)律,可根據(jù)理論推導,或對觀測數(shù)據(jù)的分析,或依據(jù)實踐經(jīng)驗,設計一種模型來代表所研究的對象。經(jīng)典的分析模型一般都是以營銷、管理等為理論基礎的。
1)戰(zhàn)略與組織
- SWOT分析:戰(zhàn)略規(guī)劃的經(jīng)典分析工具
- PEST分析:組織外部宏觀環(huán)境分析工具
- BCG矩陣法:制定公司層戰(zhàn)略最流行的工具
- GE矩陣:企業(yè)決定發(fā)展戰(zhàn)略的分析工具
- 定向政策矩陣:戰(zhàn)略業(yè)務組合計劃分析工具
- IE矩陣:標識企業(yè)分布地位的分析工具
- 競爭態(tài)勢矩陣:企業(yè)戰(zhàn)略制定提供競爭優(yōu)勢的分析工具
- 麥肯錫三層面分析:企業(yè)設計戰(zhàn)略規(guī)劃、開拓增長的有效工具
- 波特五力分析:行業(yè)競爭戰(zhàn)略最流行的分析工具
- 戰(zhàn)略集團分析法:行業(yè)內企業(yè)競爭格局分析工具
- 戰(zhàn)略鐘模型:企業(yè)競爭戰(zhàn)略選擇分析工具
- 核心競爭力分析:分析企業(yè)有效競爭和成長的重要工具
- 波特價值鏈分析模型:尋求確定企業(yè)競爭優(yōu)勢的分析工具
- 利益相關者分析:戰(zhàn)略制定和戰(zhàn)略評價分析工具
- PIMS分析法:有效的戰(zhàn)略評價分析工具
- SPACE矩陣:企業(yè)外部環(huán)境及戰(zhàn)略組合分析工具
- QSPM矩陣:戰(zhàn)略決策階段重要分析工具
- 三四規(guī)則矩陣:成熟市場中企業(yè)競爭地位分析工具
- 7S模型:組織績效與戰(zhàn)略適應的分析工具20.3C戰(zhàn)略三角模型:經(jīng)典的營銷戰(zhàn)略管理工具
2)營銷服務
- STP分析:現(xiàn)代營銷戰(zhàn)略的核心分析工具
- 4Ps營銷組合模型:制定市場戰(zhàn)略最經(jīng)典的營銷理論工具
- 產(chǎn)品生命周期模型:描述產(chǎn)品和市場運作方法的有力工具
- 安索夫矩陣:應用最廣泛的營銷分析工具之一
- 服務質量差距模型:服務質量簡單有效的分析工具
- 推銷方格理論:直觀有效的銷售分析工具
- 哈夫模型:最有效的計算商圈的分析工具之一
- 服務金三角:服務組織管理的基石
- CS戰(zhàn)略:企業(yè)提高市場占有率的有力工具
- SPIN銷售法:系統(tǒng)化挖掘客戶需求的銷售工具
- 營銷戰(zhàn)略新三角模型:戰(zhàn)略業(yè)務架構分析工具
- 服務利潤鏈:服務管理最經(jīng)典、最有效的分析工具
- 滿意鏡:提高顧客滿意與員工滿意的工具
- 顧客金字塔模型:有效的顧客細分管理工具
- 植田T理論:典型的競爭性理論策略工具
3)人力資源
- 平衡計分卡:最具影響力的戰(zhàn)略績效管理工具
- 360度績效考核:推進員工行為改變最有效的工具之一
- KPI:國際通行的企業(yè)經(jīng)營績效成果測量和戰(zhàn)略目標管理的工具
- 3P模型:實施企業(yè)人力資源戰(zhàn)略化管理的有效工具
- 職位分析問卷法:最普遍和流行的人員導向職務分析系統(tǒng)
- 關鍵事件技術:識別工作績效的關鍵性因素的工作分析方法
- 貝爾賓團隊角色理論:目前最權威、應用最廣的團隊理論
- 蓋洛普Q12測評法:最經(jīng)典的員工敬業(yè)度測評工具
- 績效棱柱模型:新穎的績效測量和管理分析工具
- Lifo管理系統(tǒng):美國應用最廣、發(fā)展最早的行為風格行為系統(tǒng)之一
- 寬帶薪酬設計:一種新的薪酬管理系統(tǒng)及操作流程
- 霍蘭德職業(yè)興趣理論:通用的職業(yè)興趣測驗工具
- 勝任素質模型:人力資源戰(zhàn)略和組織整體戰(zhàn)略緊密結合的重要工具
- 職業(yè)錨:職業(yè)測評運用最廣泛、最有效的工具之一
- 海氏工作評價系統(tǒng):目前國際上最為流行、使用最為廣泛的崗位評估工具
4)質量及生產(chǎn)管理
- TPM:生產(chǎn)改善過程中的重要工具之一
- TQM:一項持續(xù)變革的有效管理體系
- 定置管理:強化現(xiàn)場管理和謀求系統(tǒng)改善的科學管理方法
- 5S現(xiàn)場管理法:現(xiàn)場科學管理的基礎工具
- 六西格瑪:世界最先進的質量管理法
- JIT生產(chǎn)方式:使生產(chǎn)有效進行的新型生產(chǎn)方式
- QFD法:一種顧客驅動的先進質量管理應用技術
- 田口方法:質量管理利器、企業(yè)技術創(chuàng)新不可或缺的工具
- 甘特圖:最常用的項目控制管理的有效工具
- OPT:改善生產(chǎn)管理技術的新方式
- PDCA:循環(huán)有效控制管理過程和工作質量的工具
- AUDIT法:保證產(chǎn)品質量的先進質量管理控制方法
- 大規(guī)模定制:21世紀最重要的、最具競爭優(yōu)勢的生產(chǎn)模式
- 朱蘭三步曲:質量戰(zhàn)略思想和管理的有力武器
- 零缺陷管理法:企業(yè)質量管理方法的又一次革命
- QC七大手法:一組對質量管理活動的數(shù)據(jù)進行客觀分析的有力工具
- 豐田生產(chǎn)方式:一套系統(tǒng)完整的生產(chǎn)管理方式
- 5)財務管理工具
- 阿特曼Z-score模型:最著名的預測企業(yè)破產(chǎn)的方法
- ABC成本法:企業(yè)控制成本的有力工具
- 杜邦分析法:企業(yè)業(yè)績評價體系中最為有效的工具之一
- 比率分析法:財務分析最基本的工具
- 經(jīng)濟附加值:當今最熱門的財務創(chuàng)意
- 財務分析雷達圖:企業(yè)經(jīng)濟效益綜合分析工具
- 零基預算法:對企業(yè)的預算決策進行控制的有效工具
- 凈現(xiàn)值法:企業(yè)投資決策中最基本、最常用的一種方法
- 沃爾評分法:對企業(yè)財務信用能力綜合評價的方法
- 本量利分析:實施目標成本管理的一個重要工具
6)項目與物流
- SCOR模型:第一個標準的供應鏈流程參考模型,供應鏈一體化的得力工具
- ECR系統(tǒng):一種新型的供應鏈管理策略
- 快速反應策略:企業(yè)實現(xiàn)供應鏈競爭優(yōu)勢的有效管理工具
- 綠色供應鏈管理:可持續(xù)發(fā)展的供應鏈管理模式
- 責任矩陣:項目計劃十分重要的工具
- 關鍵路徑法:項目管理中應用最為廣泛的方法之一
- 邏輯框架法:項目質量評價的綜合評價方法
- PERT網(wǎng)絡分析法:有效的項目進度管理工具
- VMI模型:國際前沿的供應鏈庫存管理模式
- 工作分解結構:項目管理眾多工具中最有價值的工具之一
7)常見的分析模型
a)SWOT分析模型
用來確定企業(yè)自身的競爭優(yōu)勢、競爭劣勢、機會和威脅,從而將公司的戰(zhàn)略與公司內部資源、外部環(huán)境 有機地結合起來的一種科學的分析方法。
b)STP分析
客戶細分(Segmentation)、目標客戶選擇(Targeting)、目標客戶定位(Positioning)。
c)經(jīng)典的客戶滿意度模型
RATER指數(shù)模型、KANO模型。例如:RATER指數(shù)是全美最權威的客戶服務研究機構美國論壇公司投入數(shù)百名調查研究人員用近十年的時間對全美零售業(yè)、信用卡、銀行、制造、保險、服務維修等十四個行業(yè)的近萬名客戶服務人員和這些行業(yè)的客戶進行了細致深入的調查研究,發(fā)現(xiàn)一個可以有效衡量客戶服務質量的RATER指數(shù)。
d)PEST分析模型
是指宏觀環(huán)境的分析模型,宏觀環(huán)境又稱一般環(huán)境,是指一切影響行業(yè)和企業(yè)的宏觀因素。對宏觀環(huán)境因素作分析,不同行業(yè)和企業(yè)根據(jù)自身特點和經(jīng)營需要,分析的具體內容會有差異,但一般都應對政治(Political)、經(jīng)濟(Economic)、社會(Social)和技術(Technological)這四大類影響企業(yè)的主要外部環(huán)境因素進行分析。簡單而言,稱之為PEST分析法。
e)波特五力分析模型
是邁克爾·波特(Michael Porter)于80年代初提出,對企業(yè)戰(zhàn)略制定產(chǎn)生全球性的深遠影響。用于競爭戰(zhàn)略的分析,可以有效的分析客戶的競爭環(huán)境。五力分別是:供應商的議價能力、購買者的議價能力、潛在競爭者進入的能力、替代品的替代能力、行業(yè)內競爭者現(xiàn)在的競爭能力。五種力量的不同組合變化 最終影響行業(yè)利潤潛力變化。
f)經(jīng)典營銷管理模型4P、4C、4S、4R、4V、4I
以滿足市場需求為目標的4P理論,以追求顧客滿意為目標的4C理論,以建立顧客忠誠為目標的4R理論等。
g)用戶行為理論
h)AARRR模型
AARRR是Acquisition、Activation、Retention、Revenue、Refer這五個單詞的縮寫,分別對應用戶生命周期中的5個重要環(huán)節(jié):獲取用戶、提高用戶活躍度、提高用戶留存率、獲取收入、自傳播。AARRR模型因其掠奪式的增長方式也被稱為海盜模型,同時它也是一個典型的漏斗模型可以用來評估連續(xù)的業(yè)務流程節(jié)點轉化率。通過該模型可以有針對性的對出現(xiàn)問題的重要節(jié)點進行優(yōu)化,達到提升ROI的目的。
指標體系設計
指標體系的設計是一個業(yè)務數(shù)據(jù)化的過程。好的指標設計能夠抽象目標具體化,具有直接實踐意義。
1)什么是指標
通常我們講述的指標是指將業(yè)務單元精分后量化的度量值,譬如:DAU、訂單數(shù)、金額等。當然,原子指標還會基于維度、修飾詞、統(tǒng)計口徑而構建出派生指標。指標的核心意義是它使得業(yè)務目標可描述、可度量、可拆解。
2)什么是好指標
好的數(shù)據(jù)指標是比較性的,可以是一個比率。因為比率的可操作性強、天生比較性指標、適用于比較各種因素間的相生和相克。例如:“本周轉化率比上周高0.5個百分點”顯然比“轉化率為2%”更有意義。會計和金融分析師僅需迅速查看幾個比率就能對一個公司的基本狀況做出判斷。例如:市盈率、毛利率、利潤率,等等。
好的數(shù)據(jù)指標是簡單易懂的。如果人們不能容易記住或討論某個指標,那么通過改變它來改變公司的作為將會十分困難。
好的數(shù)據(jù)指標可以衡量當前業(yè)務的真實情況。
好的數(shù)據(jù)指標會改變行為。這是最重要的評判標準。
3)什么是指標體系
將數(shù)據(jù)指標系統(tǒng)性的組織起來,可以按照業(yè)務模型。指標體系會對按照指標不同的屬性分類及分層。
指標不成體系會怎樣?
- 從業(yè)務視角看:經(jīng)常碰到的一種現(xiàn)象是業(yè)務上線了之后發(fā)現(xiàn)數(shù)據(jù)不夠用,缺指標或缺維度。
- 從技術視角看:基于需求的變更,業(yè)務團隊技術同學將需要重新去更改設計和開發(fā)埋點,數(shù)據(jù)團隊技術則需要重新采集、清洗、存儲數(shù)據(jù)。
4)常見指標體系構建過程 業(yè)務理解業(yè)務數(shù)據(jù)化
業(yè)務理解 | 業(yè)務數(shù)據(jù)化 |
業(yè)務目標/問題 | 結果性目標 |
業(yè)務運營模式-業(yè)務可以關聯(lián)起來的關鍵因素 | 關鍵過程指標 |
關鍵業(yè)務因素和環(huán)境因素 | 關鍵指標下的延展指標 |
業(yè)務關鍵策略/項目 | 業(yè)務運作的核心指標 |
指標設計規(guī)范
隨著數(shù)據(jù)量的增大,數(shù)據(jù)指標也會越來越多,即使是同樣的命名,但定義口徑卻不一致。這對于各部門理解難度大,同時也造成了重復計算存儲的資源浪費。阿里OneData指標規(guī)范,以維度建模作為理論基礎,構建總線矩陣,定義業(yè)務域、數(shù)據(jù)域、業(yè)務過程、度量/原子指標、維度、維度屬性、修飾詞、修飾類型、時間周期、派生指標等,幫助我們形成統(tǒng)一數(shù)據(jù)標準。
第一關鍵指標原則
第一關鍵指標(OMTM:One Metric That Matters)原則就是在當前階段高于一切,你需要集中全部注意力的數(shù)字。
使用第一關鍵指標的理由:
- 它回答了現(xiàn)階段最重要的問題。
- 它促使你建立清晰的目標。
- 它關注的是整個公司層面的健康。
- 它可以提高行動力。
選擇第一關鍵指標的同時它還會解釋下一個關注點。
常見指標名詞
你所在商業(yè)領域決定了你應關注的指標。常見商業(yè)模式分類有電商類、內容類、社區(qū)類、軟件工具類、游戲類。
1)電商類
電商類的指標常見分類:
常見的指標定義如下:
- PV(page view):即頁面瀏覽量,用戶每1次對網(wǎng)站中的每個網(wǎng)頁訪問均被記錄1次。用戶對同一頁面的多次訪問,訪問量累計。在一定統(tǒng)計周期內用戶每次刷新網(wǎng)頁一次也被計算一次。
- UV(unique visitor):即獨立訪客,訪問網(wǎng)站的一臺電腦客戶端為一個訪客。
- DAU(Daily Active Users)日活躍用戶:每日登陸過的用戶數(shù)。
- WAU(Weekly Active Users)周活躍用戶:七天內登陸過的用戶數(shù)。
- MAU(Monthly Active Users)月活躍用戶:30天內登陸過的用戶數(shù)。
- 收藏人數(shù):統(tǒng)計日期內,通過該渠道訪問該商品并收藏該商品的去重買家人數(shù)。
- 收藏次數(shù):統(tǒng)計時間內,寶貝被來訪者收藏的次數(shù),一件寶貝被同一個人收藏多次記為多次。
- 加購人數(shù):統(tǒng)計時間內,訪客將商品加入購物車的訪客去重數(shù)。
- 加購次數(shù):選定周期下,該行業(yè)下商品物品被加入購物車的次數(shù)。
- 支付金額:買家拍下后支付給的金額,未剔除售中售后退款金額,預售階段付款在付清尾款當天才計入內,貨到付款訂單確認收貨時計入內。
- 支付子訂單數(shù):也被稱為支付筆數(shù),比如某個買家在某個店鋪購買了多個寶貝一起下單支付,訂單后臺會展現(xiàn)每個產(chǎn)品每個SKU粒度下會有一條記錄,這個就是一個子訂單。
- 支付轉化率:統(tǒng)計時間內,支付買家數(shù)/訪客數(shù),即來訪客戶轉化為支付買家的比例。
- 店內搜索次數(shù):在所選的終端(PC或無線)上,在店鋪內搜索關鍵詞的次數(shù),一個關鍵詞被同一個人搜索多次,記為多次。關鍵詞的一次搜索后多次翻頁查看搜索結果,搜索次數(shù)記為一次。
2)游戲類
游戲類產(chǎn)品考慮的指標很多,根據(jù)最想要知道的指標大致可以分為四大類:用戶、付費、推廣和游戲。
- 用戶類:平均同時在線人數(shù)(ACU)、最高同時在線人數(shù)(PCU)活躍用戶數(shù)(包括日/周/月活躍)、留存率(次日/三日/七日/月)、活躍用戶、每日新增用戶數(shù)、每日流失人數(shù)。
- 付費類:活躍付費賬戶(APA)、付費率(PUP)、每位用戶平均收入 ARPU(Average Revenue Per User)
- 游戲類:游戲道具消費排行、比例,平均在線時間(人均、最高、最低),游戲用戶等級分布,游戲用戶持有虛擬貨幣量(人均、最高、最低)
- 推廣類:下載量(日、周、月),注冊用戶量、激活率(日、周)。
參考資料
https://data-flair.training/blogs/data-scientist-vs-data-analyst/https://www.datapine.com/blog/data-science-vs-data-analytics/https://www.leiphone.com/news/201703/u6UW2CFBbGa4bRrN.htmlhttp://www.woshipm.com/pmd/1418055.htmlhttps://radacad.com/do-you-need-a-date-dimensionhttps://www.zhihu.com/question/20117449https://zhuanlan.zhihu.com/p/43529971https://www.cnblogs.com/fanyu2019/p/11502913.html