AIoTel下視頻編碼（一）--移動(dòng)看家視頻水印溯源技術(shù)

作者：移動(dòng)Labs 2023-09-18 07:30:31

本文將深入探討移動(dòng)看家視頻水印溯源的技術(shù)原理，以及它在保護(hù)內(nèi)容版權(quán)和追溯來源方面的重要性。

1、數(shù)字媒體的興起和視頻水印的出現(xiàn)

隨著數(shù)字媒體技術(shù)的快速發(fā)展，人們?cè)谌粘Ｉ钪性絹碓蕉嗟匾蕾囉跀?shù)字內(nèi)容，尤其是視頻內(nèi)容。視頻分享平臺(tái)的興起使得用戶可以輕松地上傳、傳播和分享視頻內(nèi)容。然而，這也帶來了一系列的版權(quán)侵權(quán)問題。許多用戶在未經(jīng)授權(quán)的情況下轉(zhuǎn)載他人的視頻內(nèi)容，嚴(yán)重侵犯了內(nèi)容制作者的版權(quán)。

為了解決視頻版權(quán)問題，提出了視頻水印技術(shù)。視頻水印是一種不可見或幾乎不可見的信息，可以嵌入到視頻中，并且不會(huì)影響觀看體驗(yàn)。這些水印可以包含視頻的版權(quán)信息、來源信息等，以證明視頻的真實(shí)性和版權(quán)歸屬。通過視頻水印技術(shù)，版權(quán)所有者可以追溯視頻的傳播路徑，從而保護(hù)其知識(shí)產(chǎn)權(quán)。

2、視頻水印溯源技術(shù)的重要性

視頻水印溯源技術(shù)作為一種有效的版權(quán)保護(hù)和來源追溯手段，具有重要的應(yīng)用價(jià)值。它不僅可以幫助版權(quán)所有者維護(hù)自己的合法權(quán)益，還可以為數(shù)字媒體行業(yè)提供更加安全可信的環(huán)境。主要體現(xiàn)在以下幾方面：

1)保護(hù)內(nèi)容版權(quán)

視頻水印溯源技術(shù)可以有效保護(hù)視頻內(nèi)容的版權(quán)。通過在視頻中嵌入不可見的水印信息，版權(quán)所有者可以對(duì)其內(nèi)容進(jìn)行認(rèn)證，并在侵權(quán)行為發(fā)生時(shí)提供確鑿的證據(jù)。這將有效遏制盜版和侵權(quán)行為，維護(hù)內(nèi)容創(chuàng)作者的權(quán)益。

2)追溯內(nèi)容來源

對(duì)于互聯(lián)網(wǎng)上的大量視頻內(nèi)容，很難追溯其真實(shí)的來源。視頻水印溯源技術(shù)可以在視頻中嵌入來源信息，通過對(duì)水印進(jìn)行解析和追蹤，可以準(zhǔn)確確定視頻的原始來源。這對(duì)于打擊虛假信息、網(wǎng)絡(luò)謠言以及追蹤犯罪行為具有重要意義。

3)提升內(nèi)容認(rèn)證可靠性

通過視頻水印溯源技術(shù)，用戶可以更加可靠地認(rèn)證視頻的真實(shí)性和完整性。在信息爆炸的時(shí)代，虛假和篡改的視頻內(nèi)容層出不窮。通過水印溯源技術(shù)，用戶可以更好地判斷視頻的可信度，減少被虛假信息欺騙的風(fēng)險(xiǎn)。

3、視頻水印溯源的技術(shù)原理與方法

視頻水印溯源技術(shù)的核心原理是在視頻中嵌入不可見的水印信息，并通過水印解析和追蹤算法對(duì)其進(jìn)行分析和識(shí)別。下面介紹幾種常見的視頻水印溯源技術(shù)方法：

3.1 空域水印嵌入方法

(1)基于LSB的水印算法

空間域上，經(jīng)典的 LSB（ Least Significant Bits）,支持的水印信息量大，對(duì)原圖影響小。最簡單和有代表性的方案就是用秘密信息代替圖像的最低有效位(LSB)或者多個(gè)位平面的所有比特的算法。 LSB隱寫原理源于圖片中的像素一般是由三種顏色組成，即三原色(紅綠藍(lán))，由這三種原色可以組成其他各種顏色，在bmp圖片的存儲(chǔ)中,每個(gè)顏色占有8bit,即有256種顏色，一共包含256的三次方顏色，即16777216中顏色，人類的眼睛可以區(qū)分約1000萬種不同的顏色，剩下無法區(qū)分的顏色就有6777216，當(dāng)我們把其中一些信息改變，圖片只發(fā)生位變化（取最低位，權(quán)值最?。耸怯X察不到這種變化的，當(dāng)時(shí)里面的信息卻發(fā)生了變化，這樣就實(shí)現(xiàn)了數(shù)字隱寫功能。下圖1的十個(gè)方塊，藍(lán)色分量的像素值依次由246遞增至255，相鄰的兩個(gè)方塊相當(dāng)于修改了LSB數(shù)據(jù)。修改LSB數(shù)據(jù)較難被肉眼分辨。但是抗干擾能力比較差，不能抵抗圖像的裁剪、縮放和jpg壓縮。

圖1 修改后的LSB數(shù)據(jù)

3.2 頻域水印嵌入方法

基于頻域的隱形水印是一種常見的隱形水印算法，在頻域嵌入水印有方面的優(yōu)勢(shì)：

人眼對(duì)于圖像中不同頻率的信號(hào)敏感程度不同，直接在頻域上進(jìn)行水印可以控制主管感知到的失真程度，以保證水印的“隱形”；
在頻域添加水印有助于控制水印的魯棒性，保證水印抵抗轉(zhuǎn)碼、壓縮、剪裁等攻擊。水印數(shù)據(jù)所屬的頻率范圍越低，魯棒性越高，但是圖像失真越大，反之亦然；
頻域的方法能夠直接嵌入編碼器，有利于減少運(yùn)算量。

接下來將介紹幾種經(jīng)典的頻域數(shù)字水印添加方法：

(1)基于傅里葉變換的水印算法

一張RGB色彩的圖像，可以看作是的矩陣，該圖像的時(shí)域可以表示成，經(jīng)過離散傅立葉變換即可得到頻域。將水印和原圖的時(shí)域表示為f₁,f₂，為了讓水印的信息能在頻域上盡量平均分布，引入隨機(jī)變換來對(duì)時(shí)域的水印進(jìn)行變換，即：

同時(shí)對(duì)原圖進(jìn)行二維離散傅立葉變換：

引入能量系數(shù)α對(duì)水印和原圖頻域合成：

通過逆變換得到時(shí)域上加了隱形水印的圖像：

下圖2是將傅里葉變換的水印算法應(yīng)用于視頻領(lǐng)域的具體流程：

圖2 傅里葉變換的水印嵌入算法

將視頻幀在頻域上完成信息疊加，通過傅里葉變換，在實(shí)部和虛部完成文字圖像疊加，再通過逆變換顯示視頻幀。

若提取出水印，則可以對(duì)添加隱形水印的圖像進(jìn)行傅立葉變換：

最后將得到的結(jié)果F減去原圖頻域并且做隨機(jī)變換的逆變換就得到了水印的時(shí)域表示：

圖3 傅里葉變換的水印提取算法

對(duì)視頻幀提取水印的方法如圖3，先對(duì)視頻幀截圖，對(duì)截圖再進(jìn)行一次傅里葉變換，得到頻域數(shù)據(jù)，對(duì)頻域幅度，即能量進(jìn)行顯示，得出頻域幅度圖，就會(huì)顯示之前疊加的文字。

(2)基于DCT域的水印技術(shù)

離散余弦變換（Discrete Cosine Transform）屬于正交變換圖像編碼方法中的一種。離散余弦變量對(duì)于一副圖像，其大部分可視化信息都集中在少數(shù)的變換系數(shù)上。因此，離散余弦變量是數(shù)據(jù)壓縮常用的一個(gè)變換編碼方法，它能將高相關(guān)數(shù)據(jù)能量集中，使得它非常適用于圖像壓縮。

在傅立葉變換過程中，如果被展開的函數(shù)是實(shí)偶函數(shù)，那么其傅立葉變換中只包含余弦項(xiàng)，基于傅立葉變換的這一特點(diǎn)，人們提出了離散余弦變換。DCT變換先將圖像函數(shù)變換成偶函數(shù)形式，再對(duì)其進(jìn)行二維離散傅立葉變換，因此DCT變換可以看成是一種簡化的傅立葉變換。其二維離散余弦變換定義如下式：

其中，

二維離散余弦反變換定義式：

其中，

基于DCT域的圖像數(shù)字水印技術(shù)的常見流程如圖4所示，圖像經(jīng)過DCT變換后，把水印數(shù)據(jù)加到選好的頻域系數(shù)上，再利用IDCT還原圖像，從而完成水印的嵌入。

圖4 基于DCT的水印嵌入算法

(3)基于小波變換的水印技術(shù)

小波變換是一種窗口面積固定但其形狀可變的時(shí)頻局部化分析方法即在低頻部分具有較高的頻率分辨率和較低的時(shí)間分辨率,在高頻部分具有較高的時(shí)間分辨率和較低的頻率分辨率,這正符合低頻信號(hào)變化緩慢而高頻信號(hào)變化迅速的特點(diǎn)所以被稱為數(shù)學(xué)顯微鏡。

人類視覺系統(tǒng)也和小波分解一樣,將圖像信息分成不同的部分,并且各個(gè)部分通過不同的通道進(jìn)入視覺皮層,所分解的各個(gè)部分分別具有以下特性：（1）反映了圖像的空間位置信息，(2)反映了圖像的空間頻率信息(3)反映了圖像的方向信息水平、垂直、對(duì)角。因此在小波域選擇適當(dāng)?shù)乃∏度胛恢煤颓度霃?qiáng)度是非常重要的。

下圖5是將基于小波變換的水印算法應(yīng)用于音視頻領(lǐng)域的具體流程：

圖5 基于小波變換的水印嵌入算法

水印提取的過程：

圖6 基于小波變換的水印提取算法

將帶有水印的視頻幀截圖進(jìn)行二級(jí)小波分解，獲取低頻區(qū)域，依據(jù)嵌入的邏輯進(jìn)行反計(jì)算提取水印，之后將提取的信息進(jìn)行Arnold反置亂，從而得到水印圖像。

(4)基于機(jī)器學(xué)習(xí)的水印嵌入方法

為了進(jìn)一步提升效果，一些研究者們也跟著流行的腳步，嘗試使用機(jī)器學(xué)習(xí)的方法實(shí)現(xiàn)隱形水印

圖7 RivaGAN網(wǎng)絡(luò)^[1]

例如RivaGAN，其框架如圖7所示。Attention模塊根據(jù)原始圖像推導(dǎo)出目標(biāo)數(shù)據(jù)的分布Attention Mask，Encoder模塊再利用這個(gè)數(shù)據(jù)將水印數(shù)據(jù)D嵌入視頻中。RivaGan在訓(xùn)練過程中分別使用了一個(gè)Critic網(wǎng)絡(luò)評(píng)估畫面失真和一個(gè)Adversary網(wǎng)絡(luò)模擬主動(dòng)攻擊，并且增加了人工設(shè)計(jì)的Noise網(wǎng)絡(luò)模擬常見的傳輸失真（包括縮放、裁剪、有損壓縮），以期同時(shí)在畫面失真和魯棒性方面得到較好的結(jié)果。

4、視頻水印溯源的應(yīng)用與前景

視頻水印溯源技術(shù)在多個(gè)領(lǐng)域具有廣泛的應(yīng)用。以下是幾個(gè)主要的應(yīng)用領(lǐng)域：

(1)數(shù)字版權(quán)保護(hù)

在數(shù)字媒體傳播過程中，視頻內(nèi)容的版權(quán)保護(hù)一直是一個(gè)重要問題。視頻水印溯源技術(shù)可以為版權(quán)所有者提供有效的保護(hù)手段，防止未經(jīng)授權(quán)的轉(zhuǎn)載和盜版行為。

(2)內(nèi)容認(rèn)證與可信度評(píng)估

視頻水印溯源技術(shù)可以用于內(nèi)容認(rèn)證和可信度評(píng)估。用戶可以通過水印信息來判斷視頻的真實(shí)性和完整性，避免受到虛假信息的誤導(dǎo)。

(3)犯罪偵查與網(wǎng)絡(luò)安全

視頻水印溯源技術(shù)在犯罪偵查和網(wǎng)絡(luò)安全方面也具有重要應(yīng)用。通過追溯視頻的來源，可以幫助調(diào)查人員追蹤犯罪嫌疑人、打擊網(wǎng)絡(luò)謠言等。

5、結(jié)論

視頻水印溯源技術(shù)作為一種有效的解決方案，可以幫助保護(hù)內(nèi)容安全和版權(quán)歸屬，以及追蹤視頻來源。通過不同的技術(shù)原理和方法，可以嵌入和提取不同類型的水印信息。實(shí)際應(yīng)用案例表明，視頻水印溯源技術(shù)在版權(quán)保護(hù)、內(nèi)容認(rèn)證和來源追蹤方面具有廣泛的應(yīng)用前景。

隨著技術(shù)的不斷發(fā)展，視頻水印溯源技術(shù)將進(jìn)一步完善和應(yīng)用于更多領(lǐng)域。然而，同時(shí)也需要關(guān)注隱私保護(hù)和濫用風(fēng)險(xiǎn)等問題。在未來，通過視頻水印溯源技術(shù)的不斷創(chuàng)新和應(yīng)用，可以為數(shù)字媒體領(lǐng)域帶來更安全、可信的環(huán)境。

責(zé)任編輯：龐桂玉來源：移動(dòng)Labs