數(shù)據(jù)可觀察性 VS 數(shù)據(jù)質(zhì)量
譯文隨著企業(yè)從越來越多的信息源收集到了無窮無盡的數(shù)據(jù)流,他們開始積累一個由數(shù)據(jù)存儲、潛在終端用戶和信息管道組成的生態(tài)系統(tǒng)。隨著生態(tài)系統(tǒng)愈加復(fù)雜,數(shù)據(jù)停機(jī),以及數(shù)據(jù)部分、錯誤、缺失或其他不準(zhǔn)確的時刻,都會成倍增加。因此,數(shù)據(jù)團(tuán)隊(duì)把大部分時間花在了數(shù)據(jù)質(zhì)量問題上,而不是花在了為企業(yè)創(chuàng)收的工作上。

數(shù)據(jù)可觀察性可以被定義為整體視圖,包括監(jiān)測、跟蹤和分流事件以防止系統(tǒng)停機(jī)。同時,數(shù)據(jù)質(zhì)量是對如何適應(yīng)數(shù)據(jù)集以滿足企業(yè)的特定需求的衡量。
它們在哪里重疊?
數(shù)據(jù)可觀察性是用來提高數(shù)據(jù)質(zhì)量的。當(dāng)組織采用數(shù)據(jù)可觀察性來提高數(shù)據(jù)質(zhì)量時,必然會有很大的效果。其中一些包括:
1、在影響用戶體驗(yàn)前發(fā)現(xiàn)數(shù)據(jù)異常,從而節(jié)約企業(yè)成本。當(dāng)異常發(fā)生時,數(shù)據(jù)可觀察性引擎會立即提醒團(tuán)隊(duì),從而使企業(yè)有時間和機(jī)會在問題影響到消費(fèi)者之前進(jìn)行調(diào)查和排除故障。由于數(shù)據(jù)工程團(tuán)隊(duì)在問題涉及利益相關(guān)者之前就得到了通知,他們可以及時修復(fù)數(shù)據(jù)管道,避免未來的異常情況危及數(shù)據(jù)完整性。
2、通過追蹤字段級線狀數(shù)據(jù)的可觀察性來改善合作,有助于理解它們之間的依賴關(guān)系。
3、通過掌握被廢棄的數(shù)據(jù)集來提高生產(chǎn)力,數(shù)據(jù)可觀察性使關(guān)鍵數(shù)據(jù)資產(chǎn)的相關(guān)性和使用模式更加透明,在不同屬性被廢棄時通知他們。
4、通過減少解決令人厭煩的數(shù)據(jù)消防演習(xí)的時間來促進(jìn)成本節(jié)約,并重新獲得對關(guān)鍵決策數(shù)據(jù)的信任。
5、更好的協(xié)調(diào)數(shù)據(jù)工程和數(shù)據(jù)分析師團(tuán)隊(duì)之間的關(guān)系,有助于理解數(shù)據(jù)資產(chǎn)之間的關(guān)鍵依賴關(guān)系。
6、通過增加對數(shù)據(jù)資產(chǎn)的健康狀況、使用模式和相關(guān)性的端到端可視性,推動更高的效率和生產(chǎn)力。
由此,可以得出結(jié)論,數(shù)據(jù)可觀察性和數(shù)據(jù)質(zhì)量依賴企業(yè)的良好運(yùn)作。盡管有區(qū)別,但兩者在各種方面都有重疊,有助于提高數(shù)據(jù)質(zhì)量,更好的交付產(chǎn)品。
原文標(biāo)題:Data observability vs data quality
原文作者:Vanitha



































