保障Hadoop數(shù)據(jù)安全的十大措施
Dataguise最近發(fā)布了Hadoop十大數(shù)據(jù)安全措施,內(nèi)容涵蓋隱私風險、數(shù)據(jù)管理和信息安全等,可以幫助專業(yè)人士降低大數(shù)據(jù)應用的潛在數(shù)據(jù)泄漏和政策違規(guī)等風險,對于那些考慮部署Hadoop的企業(yè)來說非常值得參考。
Dataguise為多家財富200強企業(yè)提供Hadoop安全服務,總結(jié)出了一套適合大規(guī)模多樣化環(huán)境的大數(shù)據(jù)安全實踐和流程。
大數(shù)據(jù)分析向來伴隨著隱私話題和爭議,在大數(shù)據(jù)分析中的海量數(shù)據(jù)里,難免會出現(xiàn)姓名、地址和身份號碼等個人隱私信息PII(Personally Identifiable Information)。
而大量金融數(shù)據(jù)中類似信用卡和銀行賬戶號碼中難免也會攜帶上述個人信息,對這些數(shù)據(jù)的訪問將引起極大的爭議。但是通過縝密的計劃、測試、生產(chǎn)預備工作,以及對大數(shù)據(jù)技術(shù)的合理應用,大多數(shù)隱私問題都可以得到緩解。
以下是Dataguise給出的Hadoop項目實施的最佳安全實踐,尤其對項目初期的規(guī)劃階段有重要參考價值:
1.數(shù)據(jù)隱私措施越早越好。在規(guī)劃階段就明確數(shù)據(jù)隱私保護策略,最好在將數(shù)據(jù)導入Hadoop之前完成,這可以防患未然。
2.明確你所在企業(yè)中哪些數(shù)據(jù)元素屬于敏感數(shù)據(jù)。充分考慮企業(yè)的隱私政策,相關(guān)行業(yè)規(guī)定和政府法規(guī)。
3.審視分析環(huán)境和裝配Hadoop系統(tǒng)的過程中是否藏有/夾帶敏感數(shù)據(jù)。
4.收集足夠信息來明確合規(guī)風險。
5.明確業(yè)務分析是否需要訪問真實數(shù)據(jù),或“脫敏”數(shù)據(jù)能否使用。然后選擇合適的敏感信息遮擋和加密等矯正技術(shù)(masking or encryption)。遮擋(masking)技術(shù)提供最好的安全性能,而加密則更具靈活性,視將來的需要而定。
6.確保數(shù)據(jù)保護方案能夠同時支持遮擋和加密兩種數(shù)據(jù)矯正技術(shù),尤其是當需要將經(jīng)過遮擋處理和未經(jīng)遮擋的兩個版本的數(shù)據(jù)分別存放于不同的Hadoop目錄下的時候。
7.確保數(shù)據(jù)保護技術(shù)對所有數(shù)據(jù)文件提供一致的masking方式,這樣可以保證在各個數(shù)據(jù)匯聚維度上的分析的準確性。
8.確定特定數(shù)據(jù)集是否需要定制的保護方案,出于數(shù)據(jù)單元安全管理的需要,可以考慮將Hadoop目錄劃分成更小的群組。
9.確保你選擇的加密方案與企業(yè)的訪問控制技術(shù)能夠互操作,這樣特定級別和身份的用戶只能訪問Hadoop集群中特定的數(shù)據(jù)范圍。
10.當需要使用加密技術(shù)的時候,確保部署合適的技術(shù)(Java、Pig等)實現(xiàn)無縫加密,同時確保對數(shù)據(jù)的無障礙訪問。
通過及早啟動并建立敏感數(shù)據(jù)預案,企業(yè)能盡早發(fā)現(xiàn)Hadoop環(huán)境中的敏感數(shù)據(jù),分析合規(guī)風險并合理采用數(shù)據(jù)保護技術(shù),這不但能大大降低數(shù)據(jù)泄漏和合規(guī)風險,還能提高大數(shù)據(jù)項目的投資回報。
原文鏈接:http://www.ctocio.com/ccnews/12016.html