從使館焚燒文件說說碎紙及復(fù)原技術(shù)
7月21日,美國政府悍然要求中國在72小時內(nèi)關(guān)閉駐休斯敦總領(lǐng)館,且只給出中方3天的撤離時間。當(dāng)日下午,中國駐休斯敦總領(lǐng)館人員開始進(jìn)行文件焚燒,處理相關(guān)機(jī)密文件。領(lǐng)事館焚燒文件引起了美國民眾的廣泛關(guān)注,社交媒體上也一邊倒地認(rèn)為中國在燒毀證據(jù)。其實,對于機(jī)密文件的銷毀,焚燒文件僅僅是一種普通、簡單但又行之有效的文件銷毀方式。但在日常生活當(dāng)中,我們一般采用碎紙機(jī)粉碎的方式來處理內(nèi)部文件。但是碎紙機(jī)粉碎文件真的安全嗎?有沒有可能被拼湊復(fù)原呢?
碎紙機(jī)的核心部件是刀具,這組刀具是可以旋轉(zhuǎn)的,刀刃互相咬合,當(dāng)有紙張進(jìn)入時,旋轉(zhuǎn)的刀刃會把紙張切碎成條狀或者顆粒狀,如圖1所示。
圖1 碎紙機(jī)刀具示意圖
碎紙機(jī)的性能除了碎紙顆粒的大小外,還包括一次性碎紙的紙張厚度、持續(xù)碎紙的時間等等。但最關(guān)鍵的指標(biāo),仍然是碎紙顆粒的大小。
從電商網(wǎng)站上搜索碎紙機(jī)可以發(fā)現(xiàn),目前商用碎紙機(jī)的指標(biāo)一般采用德國標(biāo)準(zhǔn)DIN 66399。如圖2所示,德國紙張粉碎標(biāo)準(zhǔn)分為P2-P7級,其中P2級最低,P7級最高。P2級用于內(nèi)部非涉密資料的紙張銷毀,粉碎后的顆粒表面積不超過800平方毫米,P3用于敏感保密信息,粉碎后的顆粒表面積不超過320平方毫米。以此類推,P7用于最高等級的紙質(zhì)資料銷毀,粉碎后的顆粒表面積不超過5平方毫米。
圖2 德國紙張粉碎標(biāo)準(zhǔn)
以一張A4紙為例。A4紙的尺寸是210mm*297mm,面積62370平方毫米,按照P2級粉碎,可得到78個顆粒,P3方法粉碎后得到196個顆粒,P7方法粉碎后可以得到約12474個顆粒,如圖3所示。
圖3 一張A4紙在德國標(biāo)準(zhǔn)下的粉碎顆粒數(shù)
而普通三號字的尺寸是5.64mm*5.64mm,按照P2至P7的方法可以粉碎成為不同大小的顆粒。
同時,碎紙機(jī)粉碎顆粒還原技術(shù)的研究也一直沒有停歇。
1979年,伊朗爆發(fā)伊斯蘭革命,發(fā)生了美國大使館人質(zhì)事件,事前美國大使館人員確實也進(jìn)行了文件銷毀,但由于火爐故障,只是使用碎紙機(jī)對文件進(jìn)行了粉碎。結(jié)果后來被伊朗把粉碎的紙條給拼回去,還原了機(jī)密文件(如圖4),并且因此揭發(fā)了不少美國針對伊朗的計劃。
圖4 伊朗人還原的文件
2011年,美國國防部公開舉辦了一場碎紙拼湊挑戰(zhàn)賽,要求參賽者將5份粉碎的文件重新拼湊復(fù)原出來,這五份文件一共7頁A4紙,都是手寫的文件,這些文件被破碎成為10000多個碎紙顆粒,在指定時間內(nèi)恢復(fù)最快的團(tuán)隊將獲得5萬美元的獎勵。這項比賽吸引了全球近9000個團(tuán)隊參加。由于賽程的時間限制,美國國防部高級研究計劃局局長在一份聲明中說道“很多專家都懷疑是否能在短時間內(nèi)提出解決方案。”。
其中加州大學(xué)的團(tuán)隊,采取了“眾包”的方式來解決謎題,創(chuàng)建了一個在線程序,讓來自世界各地的人可以一起解決拼湊問題。
維吉尼亞州的一家文檔成像公司的聯(lián)合創(chuàng)始人蘭德魯姆獨自解決這個問題,他費(fèi)力地將每一張碎紙拼湊在一起,仿佛在做一個拼圖游戲。
最終,這場挑戰(zhàn)賽的獲勝隊伍利用10000多個碎片完成了七頁紙的復(fù)原拼湊。他們使用了計算機(jī)的圖像識別技術(shù),當(dāng)用戶點擊特定的紙碎片時,可以推薦可能的匹配項,以此來完成高效的拼湊,并且該應(yīng)用程序由8個人用了1個月的時間開發(fā)。
圖5 美國國防部碎紙拼湊挑戰(zhàn)賽
這場競賽顯示,盡管碎紙是一個由來已久銷毀技術(shù),但碎紙技術(shù)和對應(yīng)的碎紙顆粒還原技術(shù)一直在“相生”“相克”,不斷發(fā)展,同時也是保密領(lǐng)域中不可或缺的重要一環(huán)。盡管碎紙技術(shù)仍屬于物理安全范疇,但是碎紙顆粒的還原技術(shù)已經(jīng)涉及當(dāng)前最新的技術(shù)領(lǐng)域,比如圖像識別、群智眾籌算法、人工智能、芯片計算能力等等,碎紙技術(shù)的指標(biāo)必須在充分了解這些技術(shù)水平的基礎(chǔ)上才能制定。
而作為碎紙機(jī)的使用者,我們?nèi)粘L幚硭榧堫w粒的時候同樣需要根據(jù)碎紙顆粒中信息的重要程度,妥善處理已經(jīng)破碎的顆粒,時刻牢記在代價足夠的時候,是存在能夠提高碎紙顆粒還原效率的計算機(jī)輔助算法的。
同時,碎紙機(jī)還有效率的問題。地處異國他鄉(xiāng),碎紙機(jī)的效率難以滿足銷毀的時限要求,且碎紙顆粒無法帶回妥善處理的時候,焚燒是最快的解決辦法。
參考文獻(xiàn):
[1] 德國銷毀設(shè)備產(chǎn)品手冊. http://www.hsm.eu/uploads/media/EN_HSM_Broschure_DIN_norm66399_22.pdf
[2] Chen J , Ke D , Wang Z , et al. A high splicing accuracy solution to reconstruction of cross-cut shredded text document problem[J]. Multimedia Tools and Applications, 2018, 77(15):19281-19300.
【本文為51CTO專欄作者“中國保密協(xié)會科學(xué)技術(shù)分會”原創(chuàng)稿件,轉(zhuǎn)載請聯(lián)系原作者】