偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

大數(shù)據(jù)全生命周期安全與隱私之一

安全 應(yīng)用安全
近年來,大數(shù)據(jù)受到了工業(yè)界、科技界、媒體以及政府部門的高度關(guān)注,大數(shù)據(jù)本質(zhì)上是一種基于數(shù)據(jù)處理的技術(shù),通過大量數(shù)據(jù)分析提取有價值的信息,預(yù)測未來的變化,它被認(rèn)為是推動商業(yè)和技術(shù)創(chuàng)新以及經(jīng)濟增長的新能源。

[[429534]]

近年來,大數(shù)據(jù)受到了工業(yè)界、科技界、媒體以及政府部門的高度關(guān)注,大數(shù)據(jù)本質(zhì)上是一種基于數(shù)據(jù)處理的技術(shù),通過大量數(shù)據(jù)分析提取有價值的信息,預(yù)測未來的變化,它被認(rèn)為是推動商業(yè)和技術(shù)創(chuàng)新以及經(jīng)濟增長的新能源。大數(shù)據(jù)在各個領(lǐng)域有很多優(yōu)勢和潛力,但也存在很多問題和挑戰(zhàn),如隱私保護、倫理問題、數(shù)據(jù)安全管理方法、個人信息保護和數(shù)據(jù)濫用等[1],特別是包括隱私信息的大量共享數(shù)據(jù)在互聯(lián)開放環(huán)境中被售賣和利用給人們帶來了巨大的損失,大數(shù)據(jù)安全防護工作迫在眉睫。

本文將分為上下篇,為讀者解讀大數(shù)據(jù)全生命周期各階段面臨的風(fēng)險和各種安全防護技術(shù)。上篇主要介紹當(dāng)前國際標(biāo)準(zhǔn)化組織制定的安全標(biāo)準(zhǔn)和大數(shù)據(jù)生命周期五個階段(收集、存儲、使用、利用和銷毀)面臨的風(fēng)險,下篇主要介紹數(shù)據(jù)全生命周期各階段風(fēng)險應(yīng)對安全技術(shù)。

1 . 背景介紹

1.1 大數(shù)據(jù)平臺

大數(shù)據(jù)是新一代的技術(shù),具有數(shù)據(jù)量大、產(chǎn)生速度快和數(shù)據(jù)種類繁多等多方面特點,這些數(shù)據(jù)以結(jié)構(gòu)化和半結(jié)構(gòu)化的多種形態(tài)呈現(xiàn),當(dāng)前分析和處理用戶產(chǎn)生的海量數(shù)據(jù)已經(jīng)成為政府和企業(yè)的主要任務(wù)。大數(shù)據(jù)各種組件也相繼出現(xiàn),如大數(shù)據(jù)框架Hadoop、CDH、HDP;集群管控Ambari、數(shù)據(jù)采集Flume;數(shù)據(jù)存儲HBase;數(shù)據(jù)處理Flink、Spark和Storm;數(shù)據(jù)挖掘Mahout和Spark MLib等,圖1列出了大數(shù)據(jù)技術(shù)生態(tài)體系圖,這些組件相互組合使用來支持大規(guī)模數(shù)據(jù)的收集、分析和存儲等任務(wù)。

圖1 大數(shù)據(jù)技術(shù)生態(tài)體系

1.2 大數(shù)據(jù)安全

大數(shù)據(jù)由于價值密度較高,經(jīng)常成為黑客攻擊的目標(biāo),普遍存在巨大的安全需求。例如全球互聯(lián)網(wǎng)巨頭雅虎曾被黑客攻破用戶賬戶保護算法,導(dǎo)致數(shù)億的用戶賬號被盜、管理咨詢公司埃森哲等研究機構(gòu)2016年發(fā)布的一項研究調(diào)查結(jié)果顯示,調(diào)查的208家企業(yè)當(dāng)中,69%的企業(yè)曾在過去一年內(nèi)“遭到公司內(nèi)部人員竊取數(shù)據(jù)或試圖盜取”。傳統(tǒng)的數(shù)據(jù)安全需求主要包括數(shù)據(jù)的機密性、完整性和可用性等,其目的主要防止數(shù)據(jù)在傳輸、存儲和使用等環(huán)節(jié)被泄漏和篡改。而在大數(shù)據(jù)場景下,不僅要滿足傳統(tǒng)的信息安全需求,還必須應(yīng)對大數(shù)據(jù)特性所帶來的各項技術(shù)挑戰(zhàn),主要有如下三個挑戰(zhàn),挑戰(zhàn)之一是如何滿足可用性的前提下保護大數(shù)據(jù)的機密性,挑戰(zhàn)之二是如何實現(xiàn)大數(shù)據(jù)的安全共享,挑戰(zhàn)之三是如何實現(xiàn)大數(shù)據(jù)的真實驗證和可信溯源。

通常,大數(shù)據(jù)平臺中有五種類型的角色(數(shù)據(jù)提供者、數(shù)據(jù)收集者、存儲管理者、分析師和決策者),圖2是大數(shù)據(jù)平臺的一個簡單應(yīng)用場景。

圖2 大數(shù)據(jù)的簡單應(yīng)用場景

數(shù)據(jù)采集器通過物聯(lián)網(wǎng)設(shè)備、社交網(wǎng)絡(luò)服務(wù)等多種途徑收集數(shù)據(jù)。采集的數(shù)據(jù)可能包含敏感信息,因此必須采取適當(dāng)?shù)臄?shù)據(jù)隱私處理安全措施。存儲管理者通過云環(huán)境和分布式存儲系統(tǒng)來存儲數(shù)據(jù),存儲階段可能包含來自數(shù)據(jù)提供者的敏感信息,應(yīng)該使用各種安全技術(shù)來安全管理這些信息,防止數(shù)據(jù)泄漏,另外數(shù)據(jù)刪除應(yīng)按照法規(guī)執(zhí)行,以確保數(shù)據(jù)提供者的權(quán)利。數(shù)據(jù)分析師可以分析存儲庫中的數(shù)據(jù),以獲得適當(dāng)?shù)姆治鼋Y(jié)果,在挖掘和分析過程中可能會出現(xiàn)各種隱私數(shù)據(jù)挖掘問題,分析師要使用隱私保護技術(shù)來平衡數(shù)據(jù)的可用性和隱私性之間的關(guān)系。決策者以可視化等方式利用分析的結(jié)果,這些結(jié)果很多情況只能給特定用戶展示,需要隱私保護技術(shù)防止無意的隱私泄漏。

2 . 數(shù)據(jù)安全標(biāo)準(zhǔn)

數(shù)據(jù)安全標(biāo)準(zhǔn)分為法律標(biāo)準(zhǔn)和事實標(biāo)準(zhǔn)。法律標(biāo)準(zhǔn)由現(xiàn)有的標(biāo)準(zhǔn)化組織經(jīng)過一定程序和審議制定的標(biāo)準(zhǔn),組織包括ISO、ITU、ISO/IEC 單位JTC1、NIST、SAC和BSI等。事實標(biāo)準(zhǔn)是由特定領(lǐng)域的公司和組織如建立的標(biāo)準(zhǔn),因其知名度而影響著市場經(jīng)濟,其地位也在不斷加強,制定了一系列大數(shù)據(jù)相關(guān)的事實標(biāo)準(zhǔn),組織單位包括TTA、TM論壇、IEEE-SA和Apache等。

2.1 法律標(biāo)準(zhǔn)

國際標(biāo)準(zhǔn)化組織(ISO)是1947年成立的一個國際標(biāo)準(zhǔn)化組織,由各個國家標(biāo)準(zhǔn)組織的代表組成,旨在解決不同國家不同工業(yè)和商業(yè)標(biāo)準(zhǔn)可能產(chǎn)生的問題[2]。目前開發(fā)了很多與大數(shù)據(jù)安全相關(guān)的參考架構(gòu)和框架,如ISO/IEC 20547 Information technology-Big data- reference architecture和ISO/IEC 24668 Information technology-Artificial intelligence-Process management framework for big data analytics等,但在信息和通信等技術(shù)進步迅速的領(lǐng)域,這些標(biāo)準(zhǔn)卻往往無法跟上市場趨勢。

國家標(biāo)準(zhǔn)化委員會成立于2001年,是負(fù)責(zé)管理、監(jiān)督和協(xié)調(diào)我國整體標(biāo)準(zhǔn)化工作,促進國家在國際標(biāo)準(zhǔn)化領(lǐng)域的國家利益的全國性標(biāo)準(zhǔn)化機構(gòu),在大數(shù)據(jù)安全相關(guān)標(biāo)準(zhǔn)為《GB/T 35274-2017信息安全技術(shù)大數(shù)據(jù)業(yè)務(wù)安全能力要求》和《GB/T 37973-2019信息安全技術(shù)大數(shù)據(jù)安全管理指南》[3]。GB/T 35274-2017規(guī)定,大數(shù)據(jù)服務(wù)提供商應(yīng)具備與基礎(chǔ)安全能力相關(guān)的組織機構(gòu)和與數(shù)據(jù)生命周期相關(guān)的數(shù)據(jù)安全能力。該標(biāo)準(zhǔn)根據(jù)數(shù)據(jù)生命周期(即獲取、傳輸、存儲、處理、交換和銷毀)描述安全要求。《GB/T 37973-2019》還對大數(shù)據(jù)的安全要求和識別威脅、漏洞等安全風(fēng)險進行了描述。但是對需求的描述只是一個粗略的描述,而詳細(xì)的技術(shù)說明和必要性是不夠的。

2.2 事實標(biāo)準(zhǔn)

電信技術(shù)協(xié)會(TTA)是韓國1988年成立的信息通信領(lǐng)域標(biāo)準(zhǔn)化和標(biāo)準(zhǔn)產(chǎn)品測試的機構(gòu),是韓國唯一指定信息通信組織標(biāo)準(zhǔn)的機構(gòu),其制定的大數(shù)據(jù)相關(guān)標(biāo)準(zhǔn)takk . ko -10.0900大數(shù)據(jù)部署和利用指南。

IEEE是在美國成立的電子電氣工程及相關(guān)研究的協(xié)會,其IEEE-SA組織正在為各個行業(yè)開發(fā)大數(shù)據(jù)標(biāo)準(zhǔn)[4],通過“IEEE P7002Data隱私處理程序”、“IEEE P7006個人數(shù)據(jù)AI代理程序”等項目,正在制定大數(shù)據(jù)隱私保護標(biāo)準(zhǔn)。IEEE P7002定義了系統(tǒng)/軟件工程過程的要求,涉及產(chǎn)品、服務(wù)和利用雇員、客戶或其他外部用戶的個人數(shù)據(jù)的系統(tǒng)。IEEE P7006描述了創(chuàng)建和授權(quán)使用個性化人工智能所需的技術(shù)元素,該人工智能將包含由個人控制的輸入、學(xué)習(xí)、倫理、規(guī)則和價值觀。

Apache是專門為開源軟件項目提供支持的非盈利性組織,其中開源軟件項目“基于大數(shù)據(jù)分析的分布式處理平臺Hadoop”,通過與多個開源項目組合,生成了一個大數(shù)據(jù)生態(tài)系統(tǒng),Hadoop分布式文件系統(tǒng)項目提供了認(rèn)證和授權(quán)等安全性[5]。

2.3 現(xiàn)行標(biāo)準(zhǔn)的展望和缺陷

數(shù)據(jù)的安全和隱私是大數(shù)據(jù)需要解決的關(guān)鍵問題,但許多標(biāo)準(zhǔn)組織仍在發(fā)展或沒有涉及,雖然一些標(biāo)準(zhǔn)化組織正在制定與大數(shù)據(jù)相關(guān)的標(biāo)準(zhǔn),但標(biāo)準(zhǔn)的制定和發(fā)布需要花費大量的時間,技術(shù)的飛速發(fā)展使得已發(fā)布的標(biāo)準(zhǔn)僅將過時的技術(shù)列入其中,且沒有對這些技術(shù)進行詳細(xì)描述。因此,法律上和事實上的標(biāo)準(zhǔn)化組織需要共同發(fā)布適合市場的大數(shù)據(jù)安全和隱私標(biāo)準(zhǔn)。

3 . 安全與隱私挑戰(zhàn)

如圖3所示將大數(shù)據(jù)生命周期劃分為數(shù)據(jù)收集、存儲、分析、使用和銷毀五個階段,接下來將介紹每個階段出現(xiàn)的數(shù)據(jù)安全問題和隱私風(fēng)險。

圖3 大數(shù)據(jù)全生命周期

3.1 數(shù)據(jù)收集

數(shù)據(jù)收集階段,數(shù)據(jù)從不同的來源收集,具有不同的格式,如結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化。大數(shù)據(jù)平臺應(yīng)該將安全措施優(yōu)先用于生命周期的收集階段,平臺最重要的是獲取可靠的數(shù)據(jù),才能確保后續(xù)大數(shù)據(jù)分析以及各階段安全設(shè)計是有意義的,因此需要采取適當(dāng)?shù)拇胧﹣肀U喜杉踩?/p>

數(shù)據(jù)收集器可能會在未經(jīng)任何同意的情況下不恰當(dāng)?shù)厥占瘮?shù)據(jù),從而侵犯提供商的數(shù)據(jù)主權(quán),例如許多人在社交媒體和購物等日常活動中缺乏同意意識,無意間泄漏了自身隱私數(shù)據(jù),也有可能通過各種攻擊(如欺騙、釣魚和垃圾郵件)來獲取敏感數(shù)據(jù),因此需要采取一些授權(quán)手段對數(shù)據(jù)采集進行訪問控制。另外還需要采取額外的安全措施來防止數(shù)據(jù)泄漏,例如對某些數(shù)據(jù)字段進行加密,目前使用較廣泛的是同態(tài)加密技術(shù)。

3.2 數(shù)據(jù)存儲

在數(shù)據(jù)存儲階段,收集的數(shù)據(jù)被存儲于大型的數(shù)據(jù)中心供下一階段(即數(shù)據(jù)分析階段)使用,由于采集的數(shù)據(jù)中可能包含敏感信息,因此在存儲數(shù)據(jù)時采取有效的防范措施非常重要。存儲階段面臨的風(fēng)險是多方面的,不僅包括來自外界黑客的攻擊、來自內(nèi)部人員的信息竊取,還包括不同利益方對數(shù)據(jù)的超越權(quán)使用等。因此存儲階段需要通過物理安全和數(shù)據(jù)保護技術(shù)相結(jié)合的方式來應(yīng)對多種威脅。在數(shù)據(jù)不完全可靠的情況下,例如在云環(huán)境中,通過隱私保護技術(shù)(例如加密和屏蔽)來維護數(shù)據(jù)的完整性和機密性。由于數(shù)據(jù)規(guī)模巨大,數(shù)據(jù)存儲業(yè)務(wù)需要堅持分布式存儲,敏感數(shù)據(jù)只能通過訪問控制提供給授權(quán)人員,如果敏感數(shù)據(jù)在未經(jīng)同意的情況下被無意傳遞,必須立即銷毀。

3.3 數(shù)據(jù)分析

數(shù)據(jù)采集和存儲后,對數(shù)據(jù)進行處理和挖掘分析,生成有用的知識。數(shù)據(jù)分析階段使用了各種數(shù)據(jù)挖掘技術(shù),如聚類、分類和關(guān)聯(lián)規(guī)則挖掘,為處理和分析提供一個安全的環(huán)境非常重要。數(shù)據(jù)挖掘者可以通過強大的挖掘算法識別敏感數(shù)據(jù),使數(shù)據(jù)所有者容易受到隱私侵犯。因此,應(yīng)該保護數(shù)據(jù)挖掘過程和分析結(jié)果不受基于挖掘的攻擊,只允許授權(quán)人員參與。另外在分析數(shù)據(jù)的過程中,隱私保護的效率與數(shù)據(jù)處理的效率成反比,即在保護敏感數(shù)據(jù)的同時很難提高處理效率,因此各種保護隱私挖掘技術(shù)和去身份識別技術(shù)正在開發(fā)中解決這一關(guān)鍵問題。

3.4 數(shù)據(jù)使用

數(shù)據(jù)使用階段是利用分析階段產(chǎn)生的重要信息,通過對敏感信息的分析組合創(chuàng)建新信息,將從各個領(lǐng)域收集的數(shù)據(jù)連接起來,幫助企業(yè)和個人識別推斷一些未來判斷,絕大部分屬于敏感信息,這些信息可以在未經(jīng)同意的情況下用于其他目的。此外,決策者可能會與第三方共享敏感數(shù)據(jù),以追求商業(yè)利益,因此需要審計跟蹤技術(shù)和隱私數(shù)據(jù)發(fā)布保護技術(shù)來解決這種風(fēng)險。

3.5 數(shù)據(jù)銷毀

數(shù)據(jù)一旦不再進行預(yù)期目的分析或數(shù)據(jù)擁有者拒絕使用權(quán),則必須銷毀數(shù)據(jù)。數(shù)據(jù)銷毀主要包括物理破壞硬盤或破壞存儲內(nèi)容來破壞數(shù)據(jù)。破壞硬盤是借助外力直接粉碎存儲介質(zhì),一旦破壞將不能繼續(xù)使用。破壞數(shù)據(jù)本身如多次覆蓋寫,這些方法涉及到存儲數(shù)據(jù)的整個物理/邏輯空間的處理,很難只刪除部分?jǐn)?shù)據(jù),也很難核實處置的有效性。一些組織在達(dá)到預(yù)期目的且用戶撤回數(shù)據(jù)使用權(quán)的情況下仍然使用這些數(shù)據(jù),而且一些人員將數(shù)據(jù)售賣給第三方公司換取利益,嚴(yán)重侵害了用戶的隱私。由于大數(shù)據(jù)本身特性,在分布式環(huán)境下,數(shù)據(jù)一般會使用覆蓋寫等技術(shù)破壞而不采用破壞硬盤的方式,國防機密才會采取銷毀硬盤的方式銷毀數(shù)據(jù)。

4 . 小 結(jié)

在本篇文章中,我們解讀了國際標(biāo)準(zhǔn)組織制定的現(xiàn)行標(biāo)準(zhǔn),對相關(guān)研究分析發(fā)現(xiàn)目前的數(shù)據(jù)安全研究主要集中存儲和分析階段,數(shù)據(jù)收集和銷毀的研究較少,但大數(shù)據(jù)生命周期的各個階段都是相互關(guān)聯(lián)的,解決大數(shù)據(jù)的安全隱私問題,并不只是存儲和分析階段,希望對每個階段的安全加強都要重視起來,全方位解決數(shù)據(jù)安全問題。本文將大數(shù)據(jù)生命周期劃分為五個階段(收集、存儲、分析、使用和銷毀),為讀者解讀了大數(shù)據(jù)生命周期各階段出現(xiàn)風(fēng)險與挑戰(zhàn)。在下篇中,我們將介紹應(yīng)對這些風(fēng)險與挑戰(zhàn)的安全技術(shù)。

參考文獻(xiàn)

[1] Koo, J., Kang, G., & Kim, Y. G. (2020). Security and Privacy in Big Data Life Cycle: A Survey and Open Challenges. Sustainability, 12(24), 10571.

[2] ISO—International Organization for Standardization. Available online:

https://www.iso.org/about-us.html(accessed on 27 October 2020).

[3] SAC—Standardization Administration of China—ISO. Available online:

https://www.iso.org/member/1635.html (accessed on 27 October 2020).

[4] IEEE SA—The IEEE Standards Association—Home. Available online: https://standards.ieee.org/ (accessed on27 October 2020). 

[5] Apache Hadoop. Available online: https://hadoop.apache.org/ (accessed on 27 October 2020).

 

責(zé)任編輯:武曉燕 來源: 51CTO專欄
相關(guān)推薦

2021-10-26 16:39:34

安全隱私大數(shù)據(jù)

2020-06-05 10:05:38

安全隱私安全數(shù)據(jù)

2020-04-02 14:29:21

云安全派拓網(wǎng)絡(luò)Palo Alto N

2021-06-03 14:21:25

數(shù)據(jù)安全信息安全網(wǎng)絡(luò)安全

2022-04-19 07:20:24

軟件開發(fā)安全生命周期SSDLC應(yīng)用安全

2021-07-14 15:29:40

騰訊安全容器

2018-09-17 16:44:27

大數(shù)據(jù)安全工業(yè)大數(shù)據(jù)安全工業(yè)大數(shù)據(jù)

2021-07-30 20:45:13

大數(shù)據(jù)大數(shù)據(jù)安全

2023-10-07 00:05:07

2023-10-05 06:01:28

2023-04-19 07:50:59

?云原生生命周期管理

2023-08-07 01:23:41

2016-09-13 09:38:39

2010-02-06 10:42:41

Android Ser生命周期

2013-12-06 17:52:08

2021-09-27 11:22:39

人工智能規(guī)范隱私保護

2014-11-11 10:47:19

hadoop數(shù)據(jù)流

2010-12-03 12:22:02

局域網(wǎng)文檔文檔安全數(shù)據(jù)保護

2015-07-08 16:28:23

weak生命周期
點贊
收藏

51CTO技術(shù)棧公眾號