基于二值图像水印的古籍数字化图像版权保护及其实现
张军亮, 朱学芳
南京大学信息管理系 南京 210093
摘要

针对古籍数字化图像多为二值图像的特征,设计应用二值图像数字水印技术保护其版权的方案,分析水印嵌入的安全性和不可见性。实验结果表明,该方法能够有效地满足数字化古籍的版权保护需要。

关键词: 数字水印; 古籍数字化; 版权保护; 二值图像
中图分类号:G250.76
The Implementation of Copyright Protection for Digitalizing Ancient Books Image Based on Binary Image Watermarking
Zhang Junliang, Zhu Xuefang
Department of Information Management, Nanjing University, Nanjing 210093,China
Abstract

The paper designs the scheme of applying binary image watermarking technology for the copyright proection, and then the security and invisibility of this method are analyzed. The experiment results show that the method protection can effectively solve the problem of copyright protection in digitization of ancient books.

Keyword: Digital watermarking; Digitization of ancient books; Copyright protection; Binary image
1 引 言

古籍是珍贵的历史文物,承载着中华民族的文明成果,同时也是不可再生的文化资源,因此加强古籍的保存、保护工作意义重大。然而,仅靠政府的投入不能完全支撑古籍数字化的发展,这就要求相关的企业积极参与到该项工作中,以市场方式进行运作,避免非法商业利用[ 1]。因此,数字化古籍图像的版权问题亟待解决。数字化文献的版权保护,不仅需要相关法律法规的支持,还需要借助相应的计算机技术[ 2]。冯尉[ 3]分析了现有的版权保护技术手段,其中包括数字水印、PKI体系和数字证书技术等。利用PKI体系和数字证书技术,版权所有者难以有效地追踪版权的归属。

数字水印技术是指将特定的信息嵌入到载体中,以证明对载体的所有权等[ 4]。本文中的载体是数字化古籍图像。目前,已有许多学者致力于把数字水印技术应用于数字资源保护的研究。朱鹏[ 5]等利用小波变换和余弦变换相结合的数字水印技术来保护数字教学资源的版权;彭涓[ 6]等利用基于小波变换的数字水印技术来实现对敦煌壁画图像版权的保护;金大卫[ 7]等、刘强[ 8]等、李凤兰[ 9]分别将数字水印引入到数字防伪、数字档案版权管理、数字图书馆版权管理的应用研究中,这些学者都把数字资源作为彩色或灰度图像。然而事实上,数字化古籍图像大多是两种对比度极强的颜色组成的二值图像,因此,上述研究中的数字水印算法不能直接应用到数字化古籍图像的保护中。

本文根据数字化古籍图像大都是二值图像的特性,尝试将基于二值图像的水印技术[ 10]应用于数字化古籍图像的版权保护,提出一套具有一定实践意义的解决方案。

2 数字水印在古籍数字化版权保护中的算法设计及分析

数字水印是将水印信息隐蔽地嵌入到数字信息资源中,作为版权证明的依据。关于数字水印系统的基础知识可参考文献[11]。在水印信号嵌入前,先将水印信号置乱加密以提高水印嵌入的安全性。本文采用改进的Arnold变换[ 12]对水印信号置乱。

2.1 水印嵌入算法

水印嵌入是利用一定的规则和方法把数字水印信号嵌入到数字信息资源载体中的过程,其模型如图1(a)所示。利用数字古籍图像的二值特性,结合水印嵌入模型,设计数字化古籍的图像水印嵌入算法,如图1(b)所示:

图1 水印嵌入过程

在描述水印嵌入算法过程前,先定义几个变量:

I:原始载体图像(其大小为Ir×Ic),即数字化古籍图像。

W:水印信号,版权标识图像或伪随机码,Wr×Wc大小的二值图像。

a,b,c,d,choas_number:图像置乱参数;其中a,b,c,d为改进的Arnold变换参数,choas_number为置乱次数。

choas_location_matrix:记录水印图像经过改进的Arnold变换而引起的位置变换所形成的位置变换结构矩阵。

K1:对水印图像加密的密钥矩阵,是一个随机的{0,1}二值矩阵。

K2:对载体图像加密的密钥矩阵,是一个随机的二值矩阵。

水印嵌入过程详细步骤:

(1)分别读取数字化古籍的图像I和水印图像W。

(2)用户输入参数a,b,c,d和choas_number对水印图像置乱,并且保存位置变换结构矩阵choas_location_matrix。

(3) 把I分为大小为Wr×Wc的无不重叠的图像块,并记为Ii,j(1≤i≤Ir/Wr,1≤j≤Ic/Wc)。

(4)通过密钥K1对置乱过的水印加密(W=W⊕K1),密钥K2对图像块加密Ii,j,Ii,j=Ii,j⊕K2。

(5)计算图像块Ii,j的和,即sum(Ii,j);对该值进行sum(Ii,j)mod2,如果W(i,j)和该值相等,则不做任何变换,否则任意选择图像块Ii,j中的一个像素,对其求反。

(6)利用密钥K2对图像块Ii,j解密。

(7)循环步骤(4)-(6),直至所有的图像块都嵌入。

2.2 水印提取算法

水印提取是从待检测的数字化古籍图像中提取出水印。水印提取算法是水印嵌入算法的逆过程。水印检测的模型如图2(a)所示,由于方案中嵌入的水印信号是标识图像,因此只要提取出水印图像,就可以从视觉上对其进行判断。结合检测模型,设计了水印提取的过程,如图2(b)所示:

图2 水印提取过程

水印提取的详细步骤为:

(1)按照嵌入时的分块方式对待检测图像I’进行分块。

(2)利用密钥K2对图像块加密I’i,j,即I’i,j=I’i,j⊕K2;计算图像块I’i,j的和sum(I’i,j);对该值进行运算sum(I’i,j)mod2,记为W’(i,j)。

(3)循环步骤(2),直至所有的图像块中的信号被提取,形成可能的水印信息W’。

(4)利用K1对W’解密,W’=W’⊕K1,利用位置变换结构矩阵choas_location_matrix对其W’反置乱。

(5)判断提取信息W’与原水印图像W的相似程度。

如果水印能被正确地提取出来,表明对其图像具有版权;如果不能正确提取,说明对该图像不具有版权,从而为其版权归属提供参考依据。

2.3 安全性分析

由于古籍数字化图像版权保护的安全性要求较高,因此水印的嵌入算法也有较高的安全性要求。

在水印嵌入算法中,利用了K1,K2密钥对水印图像和数字化古籍的图像进行加密保护。如果要准确地提取水印,就要能准确估计出K1,K2的值。但K1,K2是一个Wr×Wc大小的二值随机矩阵,分别具有2Wr×Wc种可能值。此外,由于需要准确地恢复水印图像,那么a,b,c,d,choas_number就要被准确估计,或获得位置变换结构矩阵choas_location_matrix。a,b,c,d属于所有满足ad-bc=1的正整数集合,对其估计的难度更大,choas_location_matrix也只有版权所有者才能提供。

2.4 不可见性分析

由于水印图像是嵌入到数字化古籍图像中,因此要尽量减少水印嵌入过程中对于原图像的破坏,或者使嵌入水印时修改的像素所在的位置成随机分布状态,这样可以认为是由于数字采集设备的噪声引起的变换,但是并不影响研究者对其进行研究。

图像块的大小为Wr×Wc,假设每个图像块Ii,j需要修改像素的可能性为p(且如果图像块被修改,最多修改一位),所以整个图像需要修改的像素数为:p×{Invalid MML},其占整个图像I的比例为p×{Invalid MML}/(Ir×Ic)={Invalid MML}。

水印嵌入的过程中,修改像素的位置在图像块中是随机选择的,因此满足被修改像素的位置成随机分布状态。

3 实验结果及分析

采用来自“书同文”数据库中的中国历代石刻史料汇编的截图图像(见图5(a))作为实验的数字化古籍图像,数字水印图像为不同大小的二值图像(见图3(a)和图5(b)、(d))。主要分析了置乱图像对水印图像的加密的效果,以及不同容量大小的数字水印图像嵌入到载体图像以后,对载体图像的修改程度以及不可见性的影响。

在实验过程中,密钥K1,K2是利用随机函数生成的和数字水印图像一样大小的二值矩阵。并且实验中利用PSNR值(原图和改变以后图像之间差异的程度)反映水印图像经过置乱以后和原水印图像之间相似性关系的度量,以及嵌入的水印图像对于原载体图像修改程度的度量。

图3 水印置乱的实验结果
(注:b, c, d是基于Arnold变换;e, f, g, h是基于改进的Arnold变换。)

图3为原始水印图像(见图3(a))和经过多次Arnold变换及多次改进的Arnold变换的效果图。其中图3(b)、(c)、(d)分别是基于Arnold变换经过1、5、10次置乱以后的效果。图3(e)、(f)、(g)、(h)分别是基于改进的Arnold变换(其中参数设置分别为a=3, b=2,c= 4, d=3)经过1、4、6、10次置乱以后的效果。

水印原图像(见图3(a))经过不同次数置乱变换以后,原图像和置乱图像之间的PSNR值,如图4所示:

图4 水印图像置乱PSNR

图4可以看出,经过置乱以后图像和原图像的相关性比较小,而使置乱以后的图像和原水印图像的相关性较弱。因此,在水印图像嵌入前,先对其进行改进的Arnold变换,以便调高水印嵌入的安全性。

图5 石刻数字化图像中嵌入水印的实验结果

图5显示了石刻数字化的图像嵌入水印的效果图。图5(a)为“书同文”数据库中的中国历代石刻史料汇编的截图,其大小为512×512;图5(b)和(d)分别是32×32和16×16的水印图像;图5(c)和(e)为分别嵌入(b)和(d)水印以后的图像效果图。可以看出,图5(e)嵌入水印的质量比图5(c)的质量效果好,但图5(e)的嵌入的水印容量比图5(c)的水印容量大。因此,要依据应用的实际情况,调节水印嵌入的容量和水印不可见性之间的矛盾。

利用PSNR测试水印嵌入的容量对于原载体图像的视觉效果。载体图像在嵌入不同水印容量情况下的PSNR,如图6所示:

图6 嵌入不同水印容量的载体图像的PSNR

图6表明,不同大小的水印嵌入容量对于载体图像产生不同的影响,即嵌入容量越大,对载体图像影响越大。

如果采用现有的灰度、彩色图像的水印算法需要把数字化古籍图像存储为灰度或彩色图像格式。表1图5(a)利用Windows画图工具进行保存后所占存储空间的大小。

表1 不同存储格式所占存储空间

表1表明利用二值位图对数字化古籍图像进行存储所占空间最少,利用256色和24位进行图像存储所占空间最大,对其进行压缩以后所占空间也比二值位图所占空间要大。因此,采用二值图像水印技术可以有效地节省存储空间,并且算法过程是应用简单的逻辑操作,具有较高的运行速度。

4 结 语

本文依据古籍数字化图像版权保护的要求,针对古籍数字化图像多为二值图像的特性,提出了基于二值图像特性的数字水印保护方案,并详细阐述了其中的水印嵌入算法和水印提取算法,分析了算法的安全性和不可见性,并利用水印嵌入算法进行了大量的实验。实验效果表明:通过二值图像的数字水印能够有效地保护古籍数字化图像版权,该算法较灰度、彩色算法更为简单,整个过程主要是进行异或运算,同时在运算过程中利用改进的Arnold变换和密钥提高了水印嵌入的安全性,降低了运算成本。

今后将对该方案进行进一步的探索和实践,解决存在的问题和算法的缺陷,以提高水印嵌入的鲁棒性和不见性,使二值图像水印技术能够更好地保护古籍图像的版权,以保护相关单位和企业的利益,提高他们参与古籍保护的积极性,更好地保护中华民族的文明成果。

参考文献
[1] 王立清. 我国古籍数字化建设的国家控制与管理模式研究[J]. 情报资料工作, 2009 (2): 49-53. [本文引用:1]
[2] 周密, 但旺. 数字化文献及其版权保护[J]. 大学图书情报学刊, 2003, 21(1): 14-16. [本文引用:1]
[3] 冯尉. 数字版权保护技术的发展探讨[J]. 数字图书馆论坛, 2009(5): 54-59. [本文引用:1]
[4] Puhan N B, Ho A T S. Binary Document Image Watermarking for Secure Authentication Using Perceptual Modeling[C]. In: Proceedings of the 5th IEEE International Symposium on Signal Processing and Information Technology, Athens Greece, IEEE Press, 2005: 393-398. [本文引用:1]
[5] 朱鹏, 朱学芳, 赵明生. 数字教学资源版权保护技术研究[J]. 中国电化教育, 2010 (4): 125-127. [本文引用:1]
[6] 彭涓, 刘刚. 敦煌数字壁画图像的数字水印保护研究[J]. 敦煌研究, 2009 (3): 103-106, 130. [本文引用:1]
[7] 金大卫, 周宁, 陈勇越. 一种数字水印在数字防伪中的应用研究[J]. 现代图书情报技术, 2007 (6): 24-28. [本文引用:1]
[8] 刘强, 耿志东. 基于数字水印技术的档案数字化安全性研究[J]. 数字与缩微影像, 2008 (3): 33-35. [本文引用:1]
[9] 李凤兰. 一种新的数字水印算法及其在数字图书馆中的应用[J]. 数字技术与应用, 2010 (1): 44-45. [本文引用:1]
[10] 张静, 张春田. 二值图像数字水印技术综述[J]. 计算机工程, 2005 (2): 1-3, 25. [本文引用:1]
[11] Voyatzis G, Pitas I. The Use of Watermarks in the Protection of Digital Multimedia Products[J]. Proceedings of the IEEE, 1999, 87(7): 1197-1207. [本文引用:1] [JCR: 6.911]
[12] 贾松浩, 杨彩, 张海玉. 一种改进的Arnold变换[J]. 河南大学学报: 自然科学版, 2009, 39(2): 199-202. [本文引用:1]
[13] 北京书同文数字化技术有限公司[EB/OL]. [2010-06-30]. http://www.unihan.com.cn/. [本文引用:1]