1、数字媒体的兴起和视频水印的出现
随着数字媒体技术的快速发展,人们在日常生活中越来越多地依赖于数字内容,尤其是视频内容。视频分享平台的兴起使得用户可以轻松地上传、传播和分享视频内容。然而,这也带来了一系列的版权侵权问题。许多用户在未经授权的情况下转载他人的视频内容,严重侵犯了内容制作者的版权。
为了解决视频版权问题,提出了视频水印技术。视频水印是一种不可见或几乎不可见的信息,可以嵌入到视频中,并且不会影响观看体验。这些水印可以包含视频的版权信息、来源信息等,以证明视频的真实性和版权归属。通过视频水印技术,版权所有者可以追溯视频的传播路径,从而保护其知识产权。
2、视频水印溯源技术的重要性
视频水印溯源技术作为一种有效的版权保护和来源追溯手段,具有重要的应用价值。它不仅可以帮助版权所有者维护自己的合法权益,还可以为数字媒体行业提供更加安全可信的环境。主要体现在以下几方面:
1)保护内容版权
视频水印溯源技术可以有效保护视频内容的版权。通过在视频中嵌入不可见的水印信息,版权所有者可以对其内容进行认证,并在侵权行为发生时提供确凿的证据。这将有效遏制盗版和侵权行为,维护内容创作者的权益。
2)追溯内容来源
对于互联网上的大量视频内容,很难追溯其真实的来源。视频水印溯源技术可以在视频中嵌入来源信息,通过对水印进行解析和追踪,可以准确确定视频的原始来源。这对于打击虚假信息、网络谣言以及追踪犯罪行为具有重要意义。
3)提升内容认证可靠性
通过视频水印溯源技术,用户可以更加可靠地认证视频的真实性和完整性。在信息爆炸的时代,虚假和篡改的视频内容层出不穷。通过水印溯源技术,用户可以更好地判断视频的可信度,减少被虚假信息欺骗的风险。
3、视频水印溯源的技术原理与方法
视频水印溯源技术的核心原理是在视频中嵌入不可见的水印信息,并通过水印解析和追踪算法对其进行分析和识别。下面介绍几种常见的视频水印溯源技术方法:
3.1 空域水印嵌入方法
(1)基于LSB的水印算法
空间域上,经典的 LSB( Least Significant Bits),支持的水印信息量大,对原图影响小。最简单和有代表性的方案就是用秘密信息代替图像的最低有效位(LSB)或者多个位平面的所有比特的算法。 LSB隐写原理源于图片中的像素一般是由三种颜色组成,即三原色(红绿蓝),由这三种原色可以组成其他各种颜色,在bmp图片的存储中,每个颜色占有8bit,即有256种颜色,一共包含256的三次方颜色,即16777216中颜色,人类的眼睛可以区分约1000万种不同的颜色,剩下无法区分的颜色就有6777216,当我们把其中一些信息改变,图片只发生位变化(取最低位,权值最小),人是觉察不到这种变化的,当时里面的信息却发生了变化,这样就实现了数字隐写功能。下图1的十个方块,蓝色分量的像素值依次由246递增至255,相邻的两个方块相当于修改了LSB数据。修改LSB数据较难被肉眼分辨。但是抗干扰能力比较差,不能抵抗图像的裁剪、缩放和jpg压缩。
图1 修改后的LSB数据
3.2 频域水印嵌入方法
基于频域的隐形水印是一种常见的隐形水印算法,在频域嵌入水印有方面的优势:
- 人眼对于图像中不同频率的信号敏感程度不同,直接在频域上进行水印可以控制主管感知到的失真程度,以保证水印的“隐形”;
- 在频域添加水印有助于控制水印的鲁棒性,保证水印抵抗转码、压缩、剪裁等攻击。水印数据所属的频率范围越低,鲁棒性越高,但是图像失真越大,反之亦然;
- 频域的方法能够直接嵌入编码器,有利于减少运算量。
接下来将介绍几种经典的频域数字水印添加方法:
(1)基于傅里叶变换的水印算法
一张RGB色彩的图像,可以看作是的矩阵,该图像的时域可以表示成,经过离散傅立叶变换即可得到频域。将水印和原图的时域表示为f1,f2,为了让水印的信息能在频域上尽量平均分布,引入随机变换来对时域的水印进行变换,即:
同时对原图进行二维离散傅立叶变换:
引入能量系数α对水印和原图频域合成:
通过逆变换得到时域上加了隐形水印的图像:
下图2是将傅里叶变换的水印算法应用于视频领域的具体流程:
图2 傅里叶变换的水印嵌入算法
将视频帧在频域上完成信息叠加,通过傅里叶变换,在实部和虚部完成文字图像叠加,再通过逆变换显示视频帧。
若提取出水印,则可以对添加隐形水印的图像进行傅立叶变换:
最后将得到的结果F减去原图频域并且做随机变换的逆变换就得到了水印的时域表示:
图3 傅里叶变换的水印提取算法
对视频帧提取水印的方法如图3,先对视频帧截图,对截图再进行一次傅里叶变换,得到频域数据,对频域幅度,即能量进行显示,得出频域幅度图,就会显示之前叠加的文字。
(2)基于DCT域的水印技术
离散余弦变换(Discrete Cosine Transform)属于正交变换图像编码方法中的一种。离散余弦变量对于一副图像,其大部分可视化信息都集中在少数的变换系数上。因此,离散余弦变量是数据压缩常用的一个变换编码方法,它能将高相关数据能量集中,使得它非常适用于图像压缩。
在傅立叶变换过程中,如果被展开的函数是实偶函数,那么其傅立叶变换中只包含余弦项,基于傅立叶变换的这一特点,人们提出了离散余弦变换。DCT变换先将图像函数变换成偶函数形式,再对其进行二维离散傅立叶变换,因此DCT变换可以看成是一种简化的傅立叶变换。其二维离散余弦变换定义如下式:
其中,
二维离散余弦反变换定义式:
其中,
基于DCT域的图像数字水印技术的常见流程如图4所示,图像经过DCT变换后,把水印数据加到选好的频域系数上,再利用IDCT还原图像,从而完成水印的嵌入。
图4 基于DCT的水印嵌入算法
(3)基于小波变换的水印技术
小波变换是一种窗口面积固定但其形状可变的时频局部化分析方法即在低频部分具有较高的频率分辨率和较低的时间分辨率,在高频部分具有较高的时间分辨率和较低的频率分辨率,这正符合低频信号变化缓慢而高频信号变化迅速的特点所以被称为数学显微镜。
人类视觉系统也和小波分解一样,将图像信息分成不同的部分,并且各个部分通过不同的通道进入视觉皮层,所分解的各个部分分别具有以下特性:(1)反映了图像的空间位置信息,(2)反映了图像的空间频率信息(3)反映了图像的方向信息水平、垂直、对角。因此在小波域选择适当的水印嵌入位置和嵌入强度是非常重要的。
下图5是将基于小波变换的水印算法应用于音视频领域的具体流程:
图5 基于小波变换的水印嵌入算法
水印提取的过程:
图6 基于小波变换的水印提取算法
将带有水印的视频帧截图进行二级小波分解,获取低频区域,依据嵌入的逻辑进行反计算提取水印,之后将提取的信息进行Arnold反置乱,从而得到水印图像。
(4)基于机器学习的水印嵌入方法
为了进一步提升效果,一些研究者们也跟着流行的脚步,尝试使用机器学习的方法实现隐形水印
图7 RivaGAN网络[1]
例如RivaGAN,其框架如图7所示。Attention模块根据原始图像推导出目标数据的分布Attention Mask,Encoder模块再利用这个数据将水印数据D嵌入视频中。RivaGan在训练过程中分别使用了一个Critic网络评估画面失真和一个Adversary网络模拟主动攻击,并且增加了人工设计的Noise网络模拟常见的传输失真(包括缩放、裁剪、有损压缩),以期同时在画面失真和鲁棒性方面得到较好的结果。
4、视频水印溯源的应用与前景
视频水印溯源技术在多个领域具有广泛的应用。以下是几个主要的应用领域:
(1)数字版权保护
在数字媒体传播过程中,视频内容的版权保护一直是一个重要问题。视频水印溯源技术可以为版权所有者提供有效的保护手段,防止未经授权的转载和盗版行为。
(2)内容认证与可信度评估
视频水印溯源技术可以用于内容认证和可信度评估。用户可以通过水印信息来判断视频的真实性和完整性,避免受到虚假信息的误导。
(3)犯罪侦查与网络安全
视频水印溯源技术在犯罪侦查和网络安全方面也具有重要应用。通过追溯视频的来源,可以帮助调查人员追踪犯罪嫌疑人、打击网络谣言等。
5、结论
视频水印溯源技术作为一种有效的解决方案,可以帮助保护内容安全和版权归属,以及追踪视频来源。通过不同的技术原理和方法,可以嵌入和提取不同类型的水印信息。实际应用案例表明,视频水印溯源技术在版权保护、内容认证和来源追踪方面具有广泛的应用前景。
随着技术的不断发展,视频水印溯源技术将进一步完善和应用于更多领域。然而,同时也需要关注隐私保护和滥用风险等问题。在未来,通过视频水印溯源技术的不断创新和应用,可以为数字媒体领域带来更安全、可信的环境。