7種最常見(jiàn)的數(shù)據(jù)可視化錯(cuò)誤
在數(shù)據(jù)可視化領(lǐng)域,正如同在其它領(lǐng)域一樣,都有一定的規(guī)則、***實(shí)踐、指導(dǎo)方針,然后就是常識(shí)。與我們的認(rèn)識(shí)恰恰相反的是,常識(shí)是往往被忽略的,這一點(diǎn)我們會(huì)在下面的例子中看到。
就讓我們從一些最常見(jiàn)的錯(cuò)誤開(kāi)始吧!
不要把數(shù)字加起來(lái)
當(dāng)你畫(huà)一個(gè)餅圖、堆疊柱形圖或是堆疊面積圖時(shí),所有數(shù)字的總和加起來(lái)應(yīng)該是100。聽(tīng)上去似乎這種愚蠢的錯(cuò)誤根本沒(méi)必要指出,但你會(huì)因?yàn)槿藗兌啻畏高@樣的錯(cuò)誤而感到驚訝。請(qǐng)看來(lái)自??怂剐侣劦倪@一圖片:
你能看出有什么問(wèn)題嗎?這三個(gè)扇形的數(shù)字加起來(lái)不是100%而是193%。在該調(diào)查中,很可能是允許一人投好幾票的,因此餅圖很明顯不是能夠體現(xiàn)這一數(shù)據(jù)的正確選擇。
另外,如果你不讀這些數(shù)字,只是觀察餅圖的大小,你會(huì)有這樣一個(gè)印象:每位候選人得到的支持都將近三分之一。這又是一個(gè)錯(cuò)誤的結(jié)論。
為了避免這樣的錯(cuò)誤,請(qǐng)仔細(xì)檢查你的數(shù)字并且確保自己使用了標(biāo)準(zhǔn)的工具。這些工具不會(huì)讓你做出像這樣的錯(cuò)誤的餅圖。
不遵守慣例
就像餅圖的各部分加起來(lái)應(yīng)該是100,一個(gè)曲線圖的曲線向右上移動(dòng)表示數(shù)字的增長(zhǎng)。因此,當(dāng)你看到這個(gè)圖表時(shí)你認(rèn)為從2005年到2012年發(fā)生了什么?
一般的慣例會(huì)讓你認(rèn)為弗羅里達(dá)死于槍擊的人數(shù)在2005到2012年間有所下降。但當(dāng)你仔細(xì)觀察時(shí)你會(huì)意識(shí)到Y(jié)軸是顛倒的。零值在頂部而***值在底部,這違背了通常隨著曲線的上升值變大的慣例。
你不需要什么特別的東西去避免這些錯(cuò)誤。我們已經(jīng)看了足夠的圖表,從而對(duì)什么是標(biāo)準(zhǔn)有一個(gè)大體的概念。只有這樣做,你才不會(huì)出錯(cuò)。也許在某些情況下你需要違反約定,但這將是一個(gè)例外,而不是規(guī)則。
裁切不當(dāng)?shù)臄?shù)據(jù)軸
坐標(biāo)的值是為圖表提供上下文并理解,弄錯(cuò)坐標(biāo)直觀上你會(huì)得出完全錯(cuò)誤的圖片。為了更好地理解我的觀點(diǎn),請(qǐng)觀察以下圖表。
??怂剐侣劜玫袅薡軸?,F(xiàn)在看來(lái),七百多萬(wàn)的圖形高度好像是六百萬(wàn)的三倍。這當(dāng)然不是這樣的情況。這里是被糾正過(guò)的圖表。
這幅圖是不是更好一些?這幅圖以0作為基準(zhǔn)線的y軸顯示出的數(shù)據(jù),表現(xiàn)出了準(zhǔn)確的圖像。
這里有相同錯(cuò)誤的另外一個(gè)例子。
你只要不將y軸弄亂就可以避免這項(xiàng)錯(cuò)誤。當(dāng)必須要展示細(xì)節(jié)的時(shí)候,先用一個(gè)圖表給出綜合性的消息,然后再第二個(gè)圖表中具體闡釋***個(gè)圖表的某一方面。
不使用注解
算不上是錯(cuò)誤,但無(wú)疑的是在你每次做圖表時(shí)都會(huì)有一些小的缺失。有時(shí)候,在圖中僅僅可視化是不夠的,你需要在圖表中加入一些描述性的文字或者數(shù)字使之變得更有意義。要理解我的觀點(diǎn),請(qǐng)觀察如下圖表。(使用谷歌圖表制成)
這是一個(gè)非常好的圖表,有著準(zhǔn)確的標(biāo)題和坐標(biāo)軸,但是當(dāng)你觀察它的時(shí)候,你會(huì)不停的去想2015年發(fā)生了什么。是什么引發(fā)了銷售數(shù)字的突然下降?
為了回答這個(gè)問(wèn)題,你需要包括附有下降原因的正確注解:
現(xiàn)在這個(gè)比之前更好一些了吧?作為了一個(gè)讀者,你不僅知道下降已發(fā)生了,還知道為什么發(fā)生了“下降”。
不正確的氣泡尺寸
氣泡圖對(duì)于在二維空間顯示三維數(shù)據(jù)是非常有用的。不僅有x軸和y軸,而且你可以通過(guò)改變氣泡大小描繪第三種數(shù)量。
截至目前,我見(jiàn)過(guò)制作氣泡圖最普遍的問(wèn)題就是他們改變氣泡的半徑而不是改變他們的區(qū)域來(lái)顯示不同的數(shù)值。例如,請(qǐng)看這個(gè)圖表。
我知道這里存在許多錯(cuò)誤,但是為了理解剛才提到的這點(diǎn),請(qǐng)觀察最左邊的氣泡。他們代表的是9.2億美元和18.4億美元。但是這對(duì)嗎?大氣泡看上去是小氣泡的四倍。如果你不讀氣泡內(nèi)的文字,你肯定會(huì)產(chǎn)生誤解。
如果你只是改變數(shù)據(jù)的區(qū)域而不是改變其半徑比例的話,你就會(huì)很容易就避免這個(gè)錯(cuò)誤。
不完整的數(shù)據(jù)
根據(jù)下面的地圖你能得知這里的哪個(gè)公司擁有較多的市場(chǎng)份額嗎?(利用圖表生成器)
僅根據(jù)上面的地圖,你一定會(huì)認(rèn)為‘ABC’擁有更高的市場(chǎng)份額。但在這里正確的答案是——‘它是不完整的信息’。原因是:我們肯定知道ABC領(lǐng)先的州的數(shù)量比XYZ多,但是我們不知道這兩種產(chǎn)品在每個(gè)州的銷售額。
如果ABC是所有小市場(chǎng)的領(lǐng)先者,XYZ是所有大市場(chǎng)的領(lǐng)先者,將會(huì)怎樣呢?這樣在這個(gè)國(guó)家XYZ的銷售額整體上將會(huì)很高,即使它領(lǐng)先的州的數(shù)量相對(duì)較少。所以想要知道誰(shuí)擁有更大的市場(chǎng)份額,我們需要更多的數(shù)據(jù)。
難以比較
假設(shè)你是一位企業(yè)主,你的業(yè)務(wù)有全球影響力。你想要比較你的公司在不同國(guó)家的市場(chǎng)份額,用這個(gè)圖表如何?
數(shù)據(jù)可視化就是要使解讀數(shù)據(jù)更加簡(jiǎn)單而不是困難。但是,上述圖表使得讀者很難去比較。難道你不認(rèn)為下面的圖表有著更好的效果嗎?
如果在做圖表時(shí)你能從讀者的角度思考的話,那么你可以避免一些這樣或者其他類似的錯(cuò)誤?;蛘咴诔霭嬷芭哪愕耐禄蛘吲笥涯抢铽@得反饋,問(wèn)他們?cè)搱D表是否能輕易讀懂?是否可以很容易地對(duì)比兩個(gè)圖表?如有需要也可以使用標(biāo)簽。上面的餅狀圖沒(méi)有使用數(shù)據(jù)標(biāo)簽,但是堆疊柱狀圖有清晰的標(biāo)簽。
資源
數(shù)據(jù)可視化是一個(gè)廣闊的領(lǐng)域,如果你在閱讀這篇文章,那么意味著你想在這方面做得更好。所以,現(xiàn)在你已經(jīng)知道了一些常見(jiàn)的錯(cuò)誤,這里有一些可以幫助你提高的資源。
· 獲得良好的基礎(chǔ):定期關(guān)注圖表庫(kù)的更新并了解每個(gè)表格的制作方法。“制圖基礎(chǔ)知識(shí)”和“動(dòng)態(tài)數(shù)據(jù)”都是一些很好的資源。
· 使用正確的工具:使用正確的工具會(huì)使你的任務(wù)變得更加容易,因?yàn)樗鼈兊脑O(shè)計(jì)目的就是防止一些小錯(cuò)誤發(fā)生。
· 避免錯(cuò)誤:你可以犯你自己的錯(cuò)誤,或者從別人的錯(cuò)誤中學(xué)習(xí)。隨時(shí)從Junk Charts 和 WTFViz學(xué)習(xí)保持并更新別人犯的錯(cuò)誤。