近期,信息学院王晗副教授课题组在人工智能领域期刊《Neurocomputing》(中科院期刊分区表大类二区TOP,影响因子6.0),发表了题为“Hide and Track: Towards Blind Video Watermarking Network in Frequency Domain”的学术论文,第一完成单位为北京林业大学。
目前,运用卷积神经网络在视频中嵌入和提取水印是视频数字水印领域中较为新颖的研究方向。但是目前大部分方法借助RGB彩色空间隐藏水印,水印隐藏容量和水印不可见性存在瓶颈,在应对时序裁剪、帧置乱等时序攻击时水印提取准确率得不到保证。针对以上问题,课题组提出了一种基于频域分块选择机制的鲁棒视频水印网络,网络结构如图1所示,该网络由编码部分和解码部分组成,编码部分将水印隐藏在视频频域的适当位置,以确保水印的视觉不可感知性;解码部分在频域跟踪水印,以确保即使视频遭受攻击后发生失真也能完整地提取水印内容。实验结果表明,该方法在不可感知性和鲁棒性方面均优于现有方法,PSNR达到了37.59dB,LPIPS达到了1.12×10−2,在多种时序攻击下的水印提取准确率达到99%。
视频水印网络的结构图
该论文基于鲁棒视频数字水印技术研究,提出一种基于频域分块选择机制的鲁棒视频水印方法,有效解决了实际场景中视频数字水印方法在面对来自压缩域、空间域和时序等多种攻击类型时如何准确提取水印内容的问题,为视频版权保护提供了参考解决方案。
论文链接:https://www.sciencedirect.com/science/article/pii/S0925231224002066