最常用的四種大數(shù)據(jù)分析方法
本文主要講述數(shù)據(jù)挖掘分析領域中,最常用的四種數(shù)據(jù)分析方法:描述型分析、診斷型分析、預測型分析和指令型分析。
當剛涉足數(shù)據(jù)挖掘分析領域的分析師被問及,數(shù)據(jù)挖掘分析人員最重要的能力是什么時,他們給出了五花八門的答案。
其實我想告訴他們的是,數(shù)據(jù)挖掘分析領域最重要的能力是:能夠將數(shù)據(jù)轉化為非專業(yè)人士也能夠清楚理解的有意義的見解。
使用一些工具來幫助大家更好的理解數(shù)據(jù)分析在挖掘數(shù)據(jù)價值方面的重要性,是十分有必要的。其中的一個工具,叫做四維分析法。
簡單地來說,分析可被劃分為4種關鍵方法。
下面會詳細介紹這四種方法。
1. 描述型分析:發(fā)生了什么?
這是最常見的分析方法。在業(yè)務中,這種方法向數(shù)據(jù)分析師提供了重要指標和業(yè)務的衡量方法。
例如,每月的營收和損失賬單。數(shù)據(jù)分析師可以通過這些賬單,獲取大量的客戶數(shù)據(jù)。了解客戶的地理信息,就是“描述型分析”方法之一。利用可視化工具,能夠有效的增強描述型分析所提供的信息。
2. 診斷型分析:為什么會發(fā)生?
描述性數(shù)據(jù)分析的下一步就是診斷型數(shù)據(jù)分析。通過評估描述型數(shù)據(jù),診斷分析工具能夠讓數(shù)據(jù)分析師深入地分析數(shù)據(jù),鉆取到數(shù)據(jù)的核心。
良好設計的BI dashboard能夠整合:按照時間序列進行數(shù)據(jù)讀入、特征過濾和鉆取數(shù)據(jù)等功能,以便更好的分析數(shù)據(jù)。
3. 預測型分析:可能發(fā)生什么?
預測型分析主要用于進行預測。事件未來發(fā)生的可能性、預測一個可量化的值,或者是預估事情發(fā)生的時間點,這些都可以通過預測模型來完成。
預測模型通常會使用各種可變數(shù)據(jù)來實現(xiàn)預測。數(shù)據(jù)成員的多樣化與預測結果密切相關。
在充滿不確定性的環(huán)境下,預測能夠幫助做出更好的決定。預測模型也是很多領域正在使用的重要方法。
4. 指令型分析:需要做什么?
數(shù)據(jù)價值和復雜度分析的下一步就是指令型分析。指令模型基于對“發(fā)生了什么”、“為什么會發(fā)生”和“可能發(fā)生什么”的分析,來幫助用戶決定應該采取什么措施。通常情況下,指令型分析不是單獨使用的方法,而是前面的所有方法都完成之后,最后需要完成的分析方法。
例如,交通規(guī)劃分析考量了每條路線的距離、每條線路的行駛速度、以及目前的交通管制等方面因素,來幫助選擇最好的回家路線。
結論
最后需要說明,每一種分析方法都對業(yè)務分析具有很大的幫助,同時也應用在數(shù)據(jù)分析的各個方面。