AIoTel下視頻編碼(一)--移動(dòng)看家視頻水印溯源技術(shù)
1、數(shù)字媒體的興起和視頻水印的出現(xiàn)
隨著數(shù)字媒體技術(shù)的快速發(fā)展,人們?cè)谌粘I钪性絹碓蕉嗟匾蕾囉跀?shù)字內(nèi)容,尤其是視頻內(nèi)容。視頻分享平臺(tái)的興起使得用戶可以輕松地上傳、傳播和分享視頻內(nèi)容。然而,這也帶來了一系列的版權(quán)侵權(quán)問題。許多用戶在未經(jīng)授權(quán)的情況下轉(zhuǎn)載他人的視頻內(nèi)容,嚴(yán)重侵犯了內(nèi)容制作者的版權(quán)。
為了解決視頻版權(quán)問題,提出了視頻水印技術(shù)。視頻水印是一種不可見或幾乎不可見的信息,可以嵌入到視頻中,并且不會(huì)影響觀看體驗(yàn)。這些水印可以包含視頻的版權(quán)信息、來源信息等,以證明視頻的真實(shí)性和版權(quán)歸屬。通過視頻水印技術(shù),版權(quán)所有者可以追溯視頻的傳播路徑,從而保護(hù)其知識(shí)產(chǎn)權(quán)。
2、視頻水印溯源技術(shù)的重要性
視頻水印溯源技術(shù)作為一種有效的版權(quán)保護(hù)和來源追溯手段,具有重要的應(yīng)用價(jià)值。它不僅可以幫助版權(quán)所有者維護(hù)自己的合法權(quán)益,還可以為數(shù)字媒體行業(yè)提供更加安全可信的環(huán)境。主要體現(xiàn)在以下幾方面:
1)保護(hù)內(nèi)容版權(quán)
視頻水印溯源技術(shù)可以有效保護(hù)視頻內(nèi)容的版權(quán)。通過在視頻中嵌入不可見的水印信息,版權(quán)所有者可以對(duì)其內(nèi)容進(jìn)行認(rèn)證,并在侵權(quán)行為發(fā)生時(shí)提供確鑿的證據(jù)。這將有效遏制盜版和侵權(quán)行為,維護(hù)內(nèi)容創(chuàng)作者的權(quán)益。
2)追溯內(nèi)容來源
對(duì)于互聯(lián)網(wǎng)上的大量視頻內(nèi)容,很難追溯其真實(shí)的來源。視頻水印溯源技術(shù)可以在視頻中嵌入來源信息,通過對(duì)水印進(jìn)行解析和追蹤,可以準(zhǔn)確確定視頻的原始來源。這對(duì)于打擊虛假信息、網(wǎng)絡(luò)謠言以及追蹤犯罪行為具有重要意義。
3)提升內(nèi)容認(rèn)證可靠性
通過視頻水印溯源技術(shù),用戶可以更加可靠地認(rèn)證視頻的真實(shí)性和完整性。在信息爆炸的時(shí)代,虛假和篡改的視頻內(nèi)容層出不窮。通過水印溯源技術(shù),用戶可以更好地判斷視頻的可信度,減少被虛假信息欺騙的風(fēng)險(xiǎn)。
3、視頻水印溯源的技術(shù)原理與方法
視頻水印溯源技術(shù)的核心原理是在視頻中嵌入不可見的水印信息,并通過水印解析和追蹤算法對(duì)其進(jìn)行分析和識(shí)別。下面介紹幾種常見的視頻水印溯源技術(shù)方法:
3.1 空域水印嵌入方法
(1)基于LSB的水印算法
空間域上,經(jīng)典的 LSB( Least Significant Bits),支持的水印信息量大,對(duì)原圖影響小。最簡單和有代表性的方案就是用秘密信息代替圖像的最低有效位(LSB)或者多個(gè)位平面的所有比特的算法。 LSB隱寫原理源于圖片中的像素一般是由三種顏色組成,即三原色(紅綠藍(lán)),由這三種原色可以組成其他各種顏色,在bmp圖片的存儲(chǔ)中,每個(gè)顏色占有8bit,即有256種顏色,一共包含256的三次方顏色,即16777216中顏色,人類的眼睛可以區(qū)分約1000萬種不同的顏色,剩下無法區(qū)分的顏色就有6777216,當(dāng)我們把其中一些信息改變,圖片只發(fā)生位變化(取最低位,權(quán)值最?。?,人是覺察不到這種變化的,當(dāng)時(shí)里面的信息卻發(fā)生了變化,這樣就實(shí)現(xiàn)了數(shù)字隱寫功能。下圖1的十個(gè)方塊,藍(lán)色分量的像素值依次由246遞增至255,相鄰的兩個(gè)方塊相當(dāng)于修改了LSB數(shù)據(jù)。修改LSB數(shù)據(jù)較難被肉眼分辨。但是抗干擾能力比較差,不能抵抗圖像的裁剪、縮放和jpg壓縮。
圖1 修改后的LSB數(shù)據(jù)
3.2 頻域水印嵌入方法
基于頻域的隱形水印是一種常見的隱形水印算法,在頻域嵌入水印有方面的優(yōu)勢:
- 人眼對(duì)于圖像中不同頻率的信號(hào)敏感程度不同,直接在頻域上進(jìn)行水印可以控制主管感知到的失真程度,以保證水印的“隱形”;
- 在頻域添加水印有助于控制水印的魯棒性,保證水印抵抗轉(zhuǎn)碼、壓縮、剪裁等攻擊。水印數(shù)據(jù)所屬的頻率范圍越低,魯棒性越高,但是圖像失真越大,反之亦然;
- 頻域的方法能夠直接嵌入編碼器,有利于減少運(yùn)算量。
接下來將介紹幾種經(jīng)典的頻域數(shù)字水印添加方法:
(1)基于傅里葉變換的水印算法
一張RGB色彩的圖像,可以看作是的矩陣,該圖像的時(shí)域可以表示成
,經(jīng)過離散傅立葉變換即可得到頻域
。將水印和原圖的時(shí)域表示為f1,f2,為了讓水印的信息能在頻域上盡量平均分布,引入隨機(jī)變換
來對(duì)時(shí)域的水印進(jìn)行變換,即:
同時(shí)對(duì)原圖進(jìn)行二維離散傅立葉變換:
引入能量系數(shù)α對(duì)水印和原圖頻域合成:
通過逆變換得到時(shí)域上加了隱形水印的圖像:
下圖2是將傅里葉變換的水印算法應(yīng)用于視頻領(lǐng)域的具體流程:
圖2 傅里葉變換的水印嵌入算法
將視頻幀在頻域上完成信息疊加,通過傅里葉變換,在實(shí)部和虛部完成文字圖像疊加,再通過逆變換顯示視頻幀。
若提取出水印,則可以對(duì)添加隱形水印的圖像進(jìn)行傅立葉變換:
最后將得到的結(jié)果F減去原圖頻域并且做隨機(jī)變換的逆變換就得到了水印的時(shí)域表示:
圖3 傅里葉變換的水印提取算法
對(duì)視頻幀提取水印的方法如圖3,先對(duì)視頻幀截圖,對(duì)截圖再進(jìn)行一次傅里葉變換,得到頻域數(shù)據(jù),對(duì)頻域幅度,即能量進(jìn)行顯示,得出頻域幅度圖,就會(huì)顯示之前疊加的文字。
(2)基于DCT域的水印技術(shù)
離散余弦變換(Discrete Cosine Transform)屬于正交變換圖像編碼方法中的一種。離散余弦變量對(duì)于一副圖像,其大部分可視化信息都集中在少數(shù)的變換系數(shù)上。因此,離散余弦變量是數(shù)據(jù)壓縮常用的一個(gè)變換編碼方法,它能將高相關(guān)數(shù)據(jù)能量集中,使得它非常適用于圖像壓縮。
在傅立葉變換過程中,如果被展開的函數(shù)是實(shí)偶函數(shù),那么其傅立葉變換中只包含余弦項(xiàng),基于傅立葉變換的這一特點(diǎn),人們提出了離散余弦變換。DCT變換先將圖像函數(shù)變換成偶函數(shù)形式,再對(duì)其進(jìn)行二維離散傅立葉變換,因此DCT變換可以看成是一種簡化的傅立葉變換。其二維離散余弦變換定義如下式:
其中,
二維離散余弦反變換定義式:
其中,
基于DCT域的圖像數(shù)字水印技術(shù)的常見流程如圖4所示,圖像經(jīng)過DCT變換后,把水印數(shù)據(jù)加到選好的頻域系數(shù)上,再利用IDCT還原圖像,從而完成水印的嵌入。
圖4 基于DCT的水印嵌入算法
(3)基于小波變換的水印技術(shù)
小波變換是一種窗口面積固定但其形狀可變的時(shí)頻局部化分析方法即在低頻部分具有較高的頻率分辨率和較低的時(shí)間分辨率,在高頻部分具有較高的時(shí)間分辨率和較低的頻率分辨率,這正符合低頻信號(hào)變化緩慢而高頻信號(hào)變化迅速的特點(diǎn)所以被稱為數(shù)學(xué)顯微鏡。
人類視覺系統(tǒng)也和小波分解一樣,將圖像信息分成不同的部分,并且各個(gè)部分通過不同的通道進(jìn)入視覺皮層,所分解的各個(gè)部分分別具有以下特性:(1)反映了圖像的空間位置信息,(2)反映了圖像的空間頻率信息(3)反映了圖像的方向信息水平、垂直、對(duì)角。因此在小波域選擇適當(dāng)?shù)乃∏度胛恢煤颓度霃?qiáng)度是非常重要的。
下圖5是將基于小波變換的水印算法應(yīng)用于音視頻領(lǐng)域的具體流程:
圖5 基于小波變換的水印嵌入算法
水印提取的過程:
圖6 基于小波變換的水印提取算法
將帶有水印的視頻幀截圖進(jìn)行二級(jí)小波分解,獲取低頻區(qū)域,依據(jù)嵌入的邏輯進(jìn)行反計(jì)算提取水印,之后將提取的信息進(jìn)行Arnold反置亂,從而得到水印圖像。
(4)基于機(jī)器學(xué)習(xí)的水印嵌入方法
為了進(jìn)一步提升效果,一些研究者們也跟著流行的腳步,嘗試使用機(jī)器學(xué)習(xí)的方法實(shí)現(xiàn)隱形水印
圖7 RivaGAN網(wǎng)絡(luò)[1]
例如RivaGAN,其框架如圖7所示。Attention模塊根據(jù)原始圖像推導(dǎo)出目標(biāo)數(shù)據(jù)的分布Attention Mask,Encoder模塊再利用這個(gè)數(shù)據(jù)將水印數(shù)據(jù)D嵌入視頻中。RivaGan在訓(xùn)練過程中分別使用了一個(gè)Critic網(wǎng)絡(luò)評(píng)估畫面失真和一個(gè)Adversary網(wǎng)絡(luò)模擬主動(dòng)攻擊,并且增加了人工設(shè)計(jì)的Noise網(wǎng)絡(luò)模擬常見的傳輸失真(包括縮放、裁剪、有損壓縮),以期同時(shí)在畫面失真和魯棒性方面得到較好的結(jié)果。
4、視頻水印溯源的應(yīng)用與前景
視頻水印溯源技術(shù)在多個(gè)領(lǐng)域具有廣泛的應(yīng)用。以下是幾個(gè)主要的應(yīng)用領(lǐng)域:
(1)數(shù)字版權(quán)保護(hù)
在數(shù)字媒體傳播過程中,視頻內(nèi)容的版權(quán)保護(hù)一直是一個(gè)重要問題。視頻水印溯源技術(shù)可以為版權(quán)所有者提供有效的保護(hù)手段,防止未經(jīng)授權(quán)的轉(zhuǎn)載和盜版行為。
(2)內(nèi)容認(rèn)證與可信度評(píng)估
視頻水印溯源技術(shù)可以用于內(nèi)容認(rèn)證和可信度評(píng)估。用戶可以通過水印信息來判斷視頻的真實(shí)性和完整性,避免受到虛假信息的誤導(dǎo)。
(3)犯罪偵查與網(wǎng)絡(luò)安全
視頻水印溯源技術(shù)在犯罪偵查和網(wǎng)絡(luò)安全方面也具有重要應(yīng)用。通過追溯視頻的來源,可以幫助調(diào)查人員追蹤犯罪嫌疑人、打擊網(wǎng)絡(luò)謠言等。
5、結(jié)論
視頻水印溯源技術(shù)作為一種有效的解決方案,可以幫助保護(hù)內(nèi)容安全和版權(quán)歸屬,以及追蹤視頻來源。通過不同的技術(shù)原理和方法,可以嵌入和提取不同類型的水印信息。實(shí)際應(yīng)用案例表明,視頻水印溯源技術(shù)在版權(quán)保護(hù)、內(nèi)容認(rèn)證和來源追蹤方面具有廣泛的應(yīng)用前景。
隨著技術(shù)的不斷發(fā)展,視頻水印溯源技術(shù)將進(jìn)一步完善和應(yīng)用于更多領(lǐng)域。然而,同時(shí)也需要關(guān)注隱私保護(hù)和濫用風(fēng)險(xiǎn)等問題。在未來,通過視頻水印溯源技術(shù)的不斷創(chuàng)新和應(yīng)用,可以為數(shù)字媒體領(lǐng)域帶來更安全、可信的環(huán)境。