OpenHarmony啃論文俱樂部—淺析稀疏表示醫(yī)學(xué)圖像
??想了解更多內(nèi)容,請(qǐng)?jiān)L問:??
??51CTO和華為官方合作共建的鴻蒙技術(shù)社區(qū)??
本文出自ELT.ZIP團(tuán)隊(duì),ELT<=>Elite(精英),.ZIP為壓縮格式,ELT.ZIP即壓縮精英。
【本期看點(diǎn)】
- 讓你意想不到的 PNG 工作方式。
- 詳解 MPEG 十八代隱秘關(guān)系。
- AV1 | H.266 王座之戰(zhàn),誰才是最終贏家。
- 不妨走走未曾設(shè)想的醫(yī)學(xué)道路。
- 細(xì)胞神經(jīng)網(wǎng)絡(luò)也可以很瘋狂。
- 懂了!原來這就是人眼視覺系統(tǒng)(HVS)。
【技術(shù)DNA】
【智慧場(chǎng)景】
基于稀疏表示的醫(yī)學(xué)序列圖像壓縮方法
背景
- 隨著醫(yī)學(xué)影像技術(shù)的發(fā)展,近年來,各種醫(yī)學(xué)影像設(shè)備產(chǎn)生了大量的醫(yī)學(xué)數(shù)字圖像。醫(yī)學(xué)數(shù)字圖像具有內(nèi)容豐富、形象直觀的特點(diǎn),能夠很好地輔助醫(yī)療診斷。然而,因其數(shù)據(jù)量非常龐大,會(huì)占用大量的存儲(chǔ)空間和傳輸帶寬,所以有必要對(duì)醫(yī)學(xué)數(shù)字圖像數(shù)據(jù)進(jìn)行壓縮。
- 現(xiàn)有的圖像壓縮標(biāo)準(zhǔn)大都基于圖像的正交變換,其中基于離散余弦變換的JPEG壓縮標(biāo)準(zhǔn)最具代表性,JPEG算法具有優(yōu)良的壓縮性能,適用于各類圖像的壓縮。但是,JPEG算法使用固定的字典進(jìn)行編碼和解碼,將其用于醫(yī)學(xué)數(shù)字圖像的壓縮時(shí),并沒有考慮到醫(yī)學(xué)數(shù)字圖像本身的特點(diǎn)進(jìn)一步提高壓縮性能。此外,正交變換對(duì)于圖像的表示并不是最優(yōu)的,它不能稀疏地捕捉圖像的規(guī)則性和輪廓特征,因此進(jìn)一步研究圖像壓縮的突破點(diǎn)在于圖像的表示方面。
- 近幾年,稀疏表示成為圖像處理領(lǐng)域的研究熱點(diǎn)。稀疏表示理論表明,任何信號(hào)可以在過完備原子庫上稀疏地分解,即使用過完備原子庫中盡量少的原子的線性組合來表示原始信號(hào)。圖像在過完備原子庫上稀疏分解的結(jié)果十分簡(jiǎn)潔,而且在直觀上也很符合人眼的視覺特性。圖像稀疏表示的優(yōu)良持性,使其成為解決醫(yī)學(xué)數(shù)字圖像壓縮問題的新途徑。
基于稀疏表示的人臉識(shí)別算法示意圖
概念
圖像表示的冗余
圖像之所能夠被壓縮,是因?yàn)閳D像在表示的過程中存在冗余數(shù)據(jù)。包含重復(fù)信息或無關(guān)信息的數(shù)據(jù)稱為冗余數(shù)據(jù),不同的圖像表示方法采用不同的數(shù)據(jù)形式也就存在不同的冗余數(shù)據(jù)。通常數(shù)字圖像在表示中存在三種主要的數(shù)據(jù)冗余,即:編碼冗余、空間和時(shí)間冗余、不相關(guān)信息。
編碼冗余:
編碼是用于表示信息實(shí)體或者事件集合的符號(hào)系統(tǒng)。每一個(gè)信息或者事件被賦予一個(gè)編 碼符號(hào)的序列,這個(gè)序列稱為碼字。一個(gè)碼字中符號(hào)的數(shù)量為該碼字的長度。編碼冗余指的就是當(dāng)前表示給定信息的碼字的平均長度可以通過某種編碼策略而減少其長度。
空間和時(shí)間冗余:
該圖像中265種灰度是等概率出現(xiàn)的;橫向來看,沿每條線的像素是相同的,所以水平方向上的像素是最大相關(guān)的;豎向來看,因?yàn)槊織l線的灰度是隨機(jī)的,所以在垂直方向上相鄰像素是彼此獨(dú)立的。不能使用簡(jiǎn)單的變長編碼來實(shí)現(xiàn)壓縮,但在灰度矩陣中每一行的各個(gè)數(shù)據(jù)是完全相同的,若按照傳統(tǒng)矩陣的形式來表示圖像,則存在相當(dāng)大的數(shù)據(jù)冗余。這也就是圖像在空間上的冗余。圖像數(shù)據(jù)在時(shí)間上的冗余與此類似,是指在時(shí)間上,相鄰像素的相關(guān)性很大,例如序列圖像前后間有較大的相關(guān)性。
不相關(guān)信息:
一些被人類視覺系統(tǒng)忽略的或者沒有利用價(jià)值的信息,通常被稱為不相關(guān)信息,這些信息在傳統(tǒng)的表示方式中認(rèn)為是冗余的。例如,圖一是由計(jì)算機(jī)生成的圖像,肉眼看上去可以認(rèn)為它是由單一灰度組成的,這樣,所有像素由一個(gè)灰度值來表示,原始的 2562568 比特的灰度矩陣可用單一的8比特?cái)?shù)值來表示,從而達(dá)到很高的壓縮比。圖二顯示的是圖一的直方圖,可以看出,實(shí)際上不是所有像素都是同一灰度的。所以上述的壓縮方式會(huì)很小程度上破壞圖像的原始質(zhì)量,但是這種破壞很難被人類的視覺系統(tǒng)察覺到,也就是說圖一中極少部分像素灰度值的不一致可以被忽略,從而去除這種不相關(guān)信息帶來的冗余。
無損壓縮
圖像無損壓縮是使圖像信息沒有任何丟失的情況下,對(duì)表示圖像的數(shù)據(jù)某種編碼的方式進(jìn)行編碼 來減少所需要的比特?cái)?shù)。比較經(jīng)典的無損壓縮方法有哈弗曼編碼、游程編碼、算術(shù)編碼等,對(duì)于不同的圖像,根據(jù)圖像特性,采取合適的編碼方式會(huì)取得更優(yōu)的壓縮效果。圖像無損壓縮方法對(duì)于恢復(fù)后的圖像沒有任何信息損失,也就是說重建效果極好,但是這類方法對(duì)圖像的壓縮能力有限。
有損壓縮
圖像有損壓縮是指在圖像壓縮過程中允許損失一定的信息,解壓后不能完全恢復(fù)原始圖像數(shù)據(jù),但是所損失的部分對(duì)圖像質(zhì)量影響很小,不會(huì)干擾人類對(duì)圖像內(nèi)容的理解。也正是因?yàn)榇?,有損壓縮通常會(huì)帶來較高的圖像壓縮比。目前較成熟有損壓縮方法是基于離散余弦變換和基于小波變換的方法,其中基于離散余弦變換的壓縮方法以 JPEG 為代表,基于小波變換的壓縮方法以 JPEG2000 和多級(jí)樹集合分裂算法(Set Partitioning In Hierarchical Trees, SPIHT)為代表,這幾種算法具有優(yōu)秀的壓縮性能。 JPEG2000 由于版權(quán)與技術(shù)問題,目前尚未在實(shí)際中廣泛使用。JPEG是當(dāng)今最流行的圖像壓縮算法。
字典
在信號(hào)處理領(lǐng)域,字典是對(duì)數(shù)據(jù)的一種高度概括,字典可以以字典原子線性組合的方式表示數(shù)據(jù)的絕大部分信息,即使這部分?jǐn)?shù)據(jù)丟失了,我們?nèi)匀豢梢韵朕k法從字典中重構(gòu)或近似恢復(fù)這部分?jǐn)?shù)據(jù)。字典分別可以通過預(yù)定義和學(xué)習(xí)來獲得。預(yù)定義字典如DCT字典、小波字典等,構(gòu)造起來簡(jiǎn)單方便,但是對(duì)信號(hào)的適應(yīng)性一般不好。學(xué)習(xí)字典一般可以從信號(hào)中學(xué)得特征,充分表示信號(hào),被字典稀疏表示的信號(hào)可以用于許多信號(hào)處理的任務(wù),比如壓縮感知、特征提取、圖像分類、圖像去噪、壓縮。
算法
經(jīng)過多年的研究,隨著許多基于離散余弦變換和基于小波變換的圖像壓縮方法的誕生,圖像壓縮問題達(dá)到了一個(gè)重要的里程碑,同時(shí)也是個(gè)研究瓶頸?;谡蛔儞Q的圖像壓縮方法雖然能取得良好的壓縮效果,但仍然存在一些不足之處,例如正交變換不能很好地表示出圖像的輪廓,使用固定字典對(duì)醫(yī)學(xué)數(shù)字圖像壓縮不會(huì)考慮醫(yī)學(xué)圖像自身的特點(diǎn),壓縮速率較慢等等。圖像稀疏表示是近幾年興起的一種新的圖像表示方法,基于稀疏表示的圖像壓縮為解決醫(yī)學(xué)數(shù)字圖象壓縮問題提供了一種新的研究思路。
醫(yī)學(xué)序列圖像特點(diǎn)
醫(yī)學(xué)序列圖像是指在相同的成像設(shè)備下,對(duì)同一研究對(duì)象,在不同斷層的掃描切片集合或不同時(shí)間的掃描切片集合。根據(jù)切片集合的不同來源,可分為時(shí)間序列圖像和空間序列圖像。時(shí)間序列圖像是指患者延時(shí)間軸獲得的圖像集,記錄患者在一段時(shí)間內(nèi)的病患信息,例如,一位SARS病人在發(fā)病期間,每天都要拍攝胸腔CT影像,這些在時(shí)間上離散的影像,就構(gòu)成了一組相同類型的醫(yī)學(xué)時(shí)間序列圖像??臻g序列圖像是指成像設(shè)備對(duì)病人某個(gè)器官的不同斷層的掃描切片,利用這些連續(xù)的掃描切片,通過三維重建技術(shù),將人體器官以“三維”的形式真實(shí)地顯示出來,實(shí)現(xiàn)其三維可視化。
圖三.醫(yī)學(xué)序列圖像示例
醫(yī)學(xué)序列圖像有其自身的特點(diǎn),即背景比較單一,序列中相鄰的圖像包含的大部分信息是相同的, 也就是說表示這些圖像會(huì)存在大量的重復(fù)信息,圖三展示了展示了某個(gè)病例的部分顱腦 CT 圖像序列,可以看出,這些圖像序列是漸變的,即相鄰圖像的變化很小。因此,本文提出的基于稀疏表示的醫(yī)學(xué)序列圖像壓縮方法,就是首先減少序列圖像之間的相關(guān)冗余信息,然后采用稀疏表示的方法壓縮圖像數(shù)據(jù),從而達(dá)到圖像壓縮的目的。
基于稀疏表示的壓縮方法
從醫(yī)學(xué)序列圖像(圖三)的特點(diǎn)可以看出,序列中相鄰圖像存在很強(qiáng)的相似性,若將圖像劃分為指定大小的圖像塊,在這一系列的圖像塊中,會(huì)存在很多相似的圖像塊。
基于此,本文提出基千稀疏表示的醫(yī)學(xué)序列圖像壓縮方法,首先將一例序列圖像分塊,然后根據(jù)所有圖像塊之間的相似性,選擇一些圖像塊作為基準(zhǔn)塊,就是說,其他的圖像塊與基準(zhǔn)塊集合中的某一塊非常相似,可直接用該基準(zhǔn)塊來代替。在進(jìn)行相似性衡量之時(shí),一一記錄下所有圖像塊與基準(zhǔn)塊之間的對(duì)應(yīng)關(guān)系。然后只用對(duì)基準(zhǔn)塊集合進(jìn)行稀疏分解,將基準(zhǔn)塊集合分解得到的稀疏系數(shù)矩陣作為二次字典。
待表示的信號(hào)是稀疏表示模型中字典的某幾列的線性組合,而這里的二次字典,待表示的信號(hào)僅僅根據(jù)二次字典的某一列來重建,且不要求二次字典的過完備性。圖像壓縮過程中,由一系列的圖像塊計(jì)算相似性后,對(duì)一組互為相似的圖像塊只用考慮其中一個(gè),并將其設(shè)為基準(zhǔn)塊,其他的圖像塊則被認(rèn)為是副本,副本不用存儲(chǔ)。對(duì)于所有的圖像塊,需要依次為每個(gè)圖像塊存儲(chǔ)與之相似的基準(zhǔn)塊的序號(hào),即參考索引?;鶞?zhǔn)塊的序號(hào)和二次字典的列號(hào)是一一對(duì)應(yīng)的,也就是說需要指明在圖像塊重建時(shí),它是使用二次字典中哪一列的系數(shù)來重建。
此算法分為兩部分:
二次字典,字典中的每一列為稀疏系數(shù)向量,采取逐列存儲(chǔ)的方式,列中的數(shù)據(jù)為稀疏系數(shù),每個(gè)系數(shù)分別存儲(chǔ)位置索引和幅值兩個(gè)信息;
參考索引,因?yàn)閰⒖妓饕鋵?shí)就是二次字典的列號(hào),而二次字典的列數(shù)就是基準(zhǔn)塊的數(shù)量,假設(shè)相似性計(jì)算之后得到N個(gè)基準(zhǔn)塊,則參考索引的數(shù)據(jù)范圍是O~N-1。
壓縮流程如下:
圖四.基于稀疏表示的序列圖像壓縮流程
解壓縮流程如下:
圖五.基于稀疏表示的序列圖像解壓縮流程
所謂過完備字典即其基底一般是冗余的,也就是基元素的個(gè)數(shù)比維數(shù)要大。圖像在過完備基下的表示比完備正交基更加稀疏,圖像中的干凈部分可以利用少量的非零稀疏表示系數(shù)進(jìn)行線性表示,而噪聲一般認(rèn)為不具有稀疏性,因此可以根據(jù)它們之間的區(qū)別實(shí)現(xiàn)去除噪聲的目的。
算法測(cè)試
將上述提出的基于稀疏表示的序列圖像壓縮方法與傳統(tǒng)的基于稀疏表示的圖像壓縮方法、JPEG 壓縮方法作對(duì)比,圖六展示了這幾種不同方法的壓縮效果??梢钥闯?,本文方法的壓縮效果優(yōu)于傳統(tǒng)的基于稀疏表示的圖像壓縮方法,在低比特率時(shí) JPEG 壓縮效果優(yōu)于本文方法,在高比特率時(shí)該方法壓縮效果優(yōu)于JPEG。考慮到醫(yī)學(xué)圖像對(duì)圖像質(zhì)量要求很高,也就要求其峰值信噪比較高,基于稀疏表示序列圖像的方法在高峰值信噪比的情況下,能夠達(dá)到優(yōu)于JPEG的壓縮效果。
圖六.不同壓縮方法的壓縮效果比較
總結(jié)
本文介紹了基于稀疏表示的醫(yī)學(xué)序列圖像壓縮方法,該方法利用醫(yī)學(xué)序列圖像之間的相似性,建立了二次字典和參考索引,實(shí)驗(yàn)結(jié)果表明,這種對(duì)序列圖像進(jìn)行整體壓縮的方法在高峰值信噪比時(shí)其壓縮效果優(yōu)于 JPEG 壓縮標(biāo)準(zhǔn)。
??想了解更多內(nèi)容,請(qǐng)?jiān)L問:??
??51CTO和華為官方合作共建的鴻蒙技術(shù)社區(qū)??