數(shù)據(jù)科學(xué)家的高級能力:“講故事”
在不算太遙遠(yuǎn)的過去,業(yè)界對數(shù)據(jù)科學(xué)家的評判主要依據(jù)于他們發(fā)現(xiàn)、理解、管理和綜合信息的能力。隨著數(shù)據(jù)環(huán)境的不斷發(fā)展和計算能力的不斷提高,編碼技能變得越來越重要。隨著時間的推移,又出現(xiàn)了更加細(xì)致入微的技能要求,包括人工智能方法的專業(yè)知識、判斷數(shù)據(jù)真實性以及許多其他的能力。
最近,隨著許多組織開始認(rèn)識到某些高級數(shù)據(jù)科學(xué)技能的重要性,通常最缺乏的是在數(shù)據(jù)信息和業(yè)務(wù)需求之間進行轉(zhuǎn)換的能力。這種從大量數(shù)據(jù)和分析中獲得實際意義的能力,以及以一種通俗易懂的方式向其他與數(shù)據(jù)分析無關(guān)的人傳達這種理解的能力,有時被稱為數(shù)據(jù)科學(xué)故事化。通常情況下,數(shù)據(jù)科學(xué)家掌握這一技能時可能會遇到一些困難。
為銷售提供論點
現(xiàn)在請思考一個典型的場景:試著給出一個充分的理由來爭取一項投資。不管需要什么樣的正式流程,在開始階段,通常會有一場對話——有時也稱為“推銷”——其中一個或多個相關(guān)方試圖提出價值主張以承諾資金和其他資源。很多時候,在這個演講之前,我們會請一些擁有數(shù)據(jù)分析技能的人來創(chuàng)建一個支持性的論點。
有了對他們試圖證明的東西的一些理解,數(shù)據(jù)科學(xué)家可以用現(xiàn)有的數(shù)據(jù)構(gòu)建模型來支持結(jié)論。他們可以使用優(yōu)秀的工具來創(chuàng)建可視化數(shù)據(jù),這有助于數(shù)據(jù)信息的交付。團隊按照要求完成分析并將其結(jié)果交付給原始涉眾。所有這些工作都是為論點服務(wù)的。
但即使是這個簡單的場景,也包含了幾個常見的數(shù)據(jù)故事化的挑戰(zhàn)。
在一開始,往往會先有一個眾所周知的先驗結(jié)論,也就是在進行任何分析之前得出的關(guān)于結(jié)論的假設(shè)。數(shù)據(jù)科學(xué)家被要求得出一個預(yù)先確定的結(jié)論。在這種情況下,分析工作是獨立于數(shù)據(jù)科學(xué)的公式之外進行的,然后,那些被要求從數(shù)據(jù)中獲取支撐性論點的人,只是參與進來而已。
在這個關(guān)鍵的階段,信息的丟失,公式被忽略,往往會導(dǎo)致一種認(rèn)知偏差——這種偏差通常來自于一個人理解問題的方式。
基于團隊所達成的對問題的理解,分析工作繼續(xù)進行,另外一個挑戰(zhàn)就出現(xiàn)了——使用現(xiàn)有的數(shù)據(jù)。在這個階段,如果沒有考慮到手頭的數(shù)據(jù)是否足夠,甚至數(shù)據(jù)對分析工作是否具有代表性。僅僅因為可以立即獲得數(shù)據(jù)就使用數(shù)據(jù)——有時被稱為方便抽樣,經(jīng)常會帶來錯誤或不完整的結(jié)論。
最后,數(shù)據(jù)科學(xué)團隊通過數(shù)據(jù)可視化將分析結(jié)果傳遞給那些做陳述的人。任何對分析的深刻理解都丟失了,或者,在陳述時無法利用的結(jié)果。即使假設(shè)與涉眾就問題和關(guān)注點進行了一些討論,這些復(fù)雜的因素也可能在最終的演示中丟失,至少部分丟失。簡化是有效決策的關(guān)鍵,但是過度簡化可能會帶來錯誤的決策。
因此,記住關(guān)于數(shù)據(jù)科學(xué)故事化的三個有用的實踐辦法是很重要的:
讓利益相關(guān)者參與分析性敘述的創(chuàng)建。這有助于減少信息損失,確保對結(jié)論有清晰的理解,并減少最終決策中潛在的關(guān)鍵細(xì)微差別的損失。
仔細(xì)考慮數(shù)據(jù)分析方法。這支持實證的嚴(yán)謹(jǐn)性——例如,結(jié)果是否可以復(fù)制——并防止抽樣和其他一些偏差。
以簡化為目標(biāo),從而做出正確的決定。過于簡化以至于忽略可能改變決策的細(xì)節(jié),可能會是一個關(guān)鍵的缺點。可視化應(yīng)該用來講述一個故事,而不是模糊論證中的關(guān)鍵點——例如,做了什么假設(shè),為什么這些數(shù)據(jù)是得出結(jié)論的正確數(shù)據(jù)等等。
“死”于數(shù)據(jù)
在我們考慮哪些技能與未來企業(yè)決策的方式相關(guān)時,我們應(yīng)該仔細(xì)考慮一些重要的趨勢,比如聯(lián)合。
隨著數(shù)據(jù)和分析在企業(yè)中的應(yīng)用越來越廣泛,越來越多的人被要求使用數(shù)據(jù)科學(xué)技能來支持他們的工作,這是很自然的。就像當(dāng)PPT變得流行起來時,非圖形專業(yè)的人員也突然被要求了解字體、圖形表示和其他技能,但是許多人可能還沒有做好轉(zhuǎn)變的準(zhǔn)備,因而“死于PPT”。與此相對應(yīng)的,可以稱之為“死于數(shù)據(jù)”。
隨著數(shù)據(jù)和分析的聯(lián)合趨勢在企業(yè)中持續(xù)發(fā)展,企業(yè)領(lǐng)導(dǎo)者應(yīng)該仔細(xì)思考要采取哪些步驟來確保員工擁有合適的技能——例如問題公式化、理解偏差和基本前提——并且為員工提供正確的專用分析資源。
以問題為導(dǎo)向
另一個關(guān)鍵趨勢是提出解決方案。隨著人工智能和其他方法變得越來越普遍,很多時候,我們會發(fā)現(xiàn)自己在討論,如何用某一個工具或方法獲得一個應(yīng)用的解決方案。這種類型的對話非常常見,比如,“我們?nèi)绾斡萌斯ぶ悄軄砝斫饪蛻舻脑u論?”或者,“我們?nèi)绾问褂每梢暬姆绞?,來演示我們的新產(chǎn)品?”
當(dāng)我們以某個工具或技術(shù)作為導(dǎo)向時,必須非常小心——因為科學(xué)告訴我們要以問題為導(dǎo)向。考慮一下,如果我們問,“我們是否能夠訪問到關(guān)于Y這個人的數(shù)據(jù),這些數(shù)據(jù)足以理解他的評論嗎?”,或者“我們可以用什么方法來分析這些數(shù)據(jù)?”,或者“我們需要多精確才能做出決定?”這類問題更有可能促使我們在數(shù)據(jù)集、分析方法和講述故事的能力方面做出有效的選擇,并得出強有力的決策。





















