DataHunter馬珂:數(shù)據(jù)可視化分析應(yīng)該怎么玩
原創(chuàng)【51CTO.com原創(chuàng)稿件】大數(shù)據(jù)這幾年的發(fā)展速度有目共睹,而數(shù)據(jù)可視化是大數(shù)據(jù)領(lǐng)域中非常關(guān)鍵的一環(huán)。當(dāng)下,諸多企業(yè)需要通過數(shù)據(jù)分析來指導(dǎo)業(yè)務(wù)決策,這樣一來,數(shù)據(jù)可視化就有了非常大的發(fā)展?jié)摿蛻?yīng)用場(chǎng)景。因此,近些年國(guó)內(nèi)外也衍生出很多專注于該領(lǐng)域的企業(yè)級(jí)創(chuàng)業(yè)公司,DataHunter(北京數(shù)獵天下科技有限公司)便是其中之一。這家成立時(shí)間不長(zhǎng)的年輕公司,憑借數(shù)據(jù)可視化分析與數(shù)據(jù)大屏產(chǎn)品,得到了人民日?qǐng)?bào)、萬達(dá)集團(tuán)、中國(guó)移動(dòng)、三一重工、獵聘網(wǎng)等眾多客戶的認(rèn)可。
近日,DataHunter CTO馬珂接受了51CTO的專訪,同記者就探索式數(shù)據(jù)分析技術(shù)、圖形化技術(shù)、數(shù)據(jù)可視化工具等方面進(jìn)行了深入探討。馬珂曾是海軍總部工程師,長(zhǎng)期從事數(shù)據(jù)庫管理、優(yōu)化,數(shù)據(jù)挖掘和可視化相關(guān)工作,有很豐富的實(shí)踐經(jīng)驗(yàn)。
馬珂·DataHunter CTO
驗(yàn)證式與探索式數(shù)據(jù)分析相輔相成
數(shù)據(jù)分析方式主要分為驗(yàn)證式與探索式兩種,兩者相輔相成。驗(yàn)證式數(shù)據(jù)分析是目前大多數(shù)企業(yè)使用相對(duì)較多的分析方法,偏重于模型和假設(shè);而探索式數(shù)據(jù)分析更偏重于分析過程,其***的意義在于,允許分析人員或決策者在不清楚數(shù)據(jù)規(guī)律、不知道如何進(jìn)行數(shù)據(jù)建模的情況下,通過數(shù)據(jù)本身所呈現(xiàn)出的各種可視化圖表,進(jìn)行查看和分析,從而快速找到業(yè)務(wù)中存在的問題。
馬珂進(jìn)一步表示,驗(yàn)證式分析對(duì)數(shù)據(jù)質(zhì)量要求很高,這種模式必須先有想法,之后再通過數(shù)據(jù)進(jìn)行驗(yàn)證。如果數(shù)據(jù)本身出現(xiàn)問題,那么即便通過科學(xué)的數(shù)據(jù)建模進(jìn)行分析,結(jié)果也肯定是錯(cuò)誤的。相比于驗(yàn)證式分析,探索式分析對(duì)數(shù)據(jù)質(zhì)量要求相對(duì)較低,同時(shí)也不需要復(fù)雜的數(shù)據(jù)建模。
據(jù)了解,探索式數(shù)據(jù)分析概念是由貝爾實(shí)驗(yàn)室數(shù)學(xué)家John Tukey提出,他認(rèn)為,統(tǒng)計(jì)分析不應(yīng)該只重視模型和假設(shè)的驗(yàn)證,而應(yīng)該充分發(fā)揮數(shù)據(jù)分析的長(zhǎng)處,在分析過程中發(fā)現(xiàn)新的理論假設(shè)和數(shù)據(jù)模型。
馬珂介紹,DataHunter致力于為企業(yè)提供簡(jiǎn)單易用的數(shù)據(jù)可視化分析產(chǎn)品及數(shù)據(jù)大屏設(shè)計(jì)展示服務(wù),基于探索式數(shù)據(jù)分析,助力企業(yè)發(fā)現(xiàn)問題并改進(jìn)業(yè)務(wù)。數(shù)據(jù)可視化分析系統(tǒng)是核心產(chǎn)品之一,可以幫助企業(yè)對(duì)接各個(gè)業(yè)務(wù)系統(tǒng)數(shù)據(jù),打破數(shù)據(jù)孤島,并且無需復(fù)雜的數(shù)據(jù)建模,就可以進(jìn)行探索式、交互式的數(shù)據(jù)分析,從而為業(yè)務(wù)決策提供支持。數(shù)據(jù)可視化大屏是核心產(chǎn)品之二,用于業(yè)務(wù)指揮中心,會(huì)議室,展廳,展會(huì)等場(chǎng)景,支持整合多種業(yè)務(wù)數(shù)據(jù)以及動(dòng)態(tài)實(shí)時(shí)數(shù)據(jù)展示。
圖形化技術(shù)是探索式分析必不可少的支柱
探索式分析是數(shù)據(jù)分析的開端,而數(shù)據(jù)可視化是在數(shù)據(jù)分析的***一個(gè)環(huán)節(jié),用于呈現(xiàn)結(jié)論。
馬珂表示,在探索式數(shù)據(jù)分析中,圖形可以很好的幫助我們理解數(shù)據(jù),故圖形化技術(shù)是其中必不可少的支柱。圖形化技術(shù)在很多年前已經(jīng)被普遍應(yīng)用,像柱圖、餅圖、折線圖等。大數(shù)據(jù)的快速發(fā)展,讓探索式數(shù)據(jù)分析逐漸成為主流,而圖形化技術(shù)也隨之又進(jìn)入了一個(gè)新的階段。
可以說,圖形化技術(shù)使得數(shù)據(jù)分析成為一種“所見即所得”的模式。例如,在同一個(gè)業(yè)務(wù)看板上,通過協(xié)同過濾、數(shù)據(jù)鉆取等交互操作,相關(guān)圖表就會(huì)按照相應(yīng)的條件進(jìn)行聯(lián)動(dòng),從而大大提高了分析效率。
舒適度是影響數(shù)據(jù)可視化工具的核心要素
馬珂之所以選擇加入DataHunter,其一是因?yàn)閷?duì)數(shù)據(jù)、圖形有濃厚的興趣,他認(rèn)為,從大數(shù)據(jù)中觀察總結(jié)數(shù)據(jù)結(jié)果是很有意思的事情,而分析+圖形化是產(chǎn)出結(jié)果的重要手段。其二,是因?yàn)镈ataHunter是初創(chuàng)企業(yè),可以快速?zèng)Q策、快速試錯(cuò)、快速調(diào)整。
對(duì)于產(chǎn)品的期許,馬珂這樣說,數(shù)據(jù)可視化分析產(chǎn)品應(yīng)該重視舒適度,雖然DataHunter是To B的公司,但也要讓客戶用起來舒適,不產(chǎn)生困惑。“我們也會(huì)逐步讓客戶參與到整個(gè)產(chǎn)品的研發(fā)過程中來,根據(jù)實(shí)際的業(yè)務(wù)場(chǎng)景和用戶需求出發(fā),才能構(gòu)建出更加優(yōu)秀的產(chǎn)品。 ”
此外,馬珂也向51CTO記者透露了DataHunter 2018年的產(chǎn)品計(jì)劃。“未來一年,我們會(huì)在兩個(gè)方向上繼續(xù)深耕,一是客戶數(shù)據(jù)接入的適應(yīng)性,如超大數(shù)據(jù)處理、數(shù)據(jù)連接池等;二是在數(shù)據(jù)展示層面,配備完整的、可擴(kuò)展的圖形化工具。”
【51CTO原創(chuàng)稿件,合作站點(diǎn)轉(zhuǎn)載請(qǐng)注明原文作者和出處為51CTO.com】