下载
加入VIP
  • 专属下载特权
  • 现金文档折扣购买
  • VIP免费专区
  • 千万文档免费下载

上传资料

关闭

关闭

关闭

封号提示

内容

首页 基于中文字体的Word文档数字水印算法

基于中文字体的Word文档数字水印算法.doc

基于中文字体的Word文档数字水印算法

记住那些让你的心脏变坚强的人
2017-09-15 0人阅读 举报 0 0 暂无简介

简介:本文档为《基于中文字体的Word文档数字水印算法doc》,可适用于综合领域

基于中文字体的Word文档数字水印算法文章编号,()基于中文字体的Word文档数字水印算法吕伟,方勇,张野,邓远林,石稀林(四川大学电子信息学院,四川成都)摘要,针对常见的中文Word文档,分析了数字水印(DigitaWlatermarking)技术的特点和现有文本数字水印的嵌入方式,提出了一种基于中文字体的水印嵌入方式在。此基础上设计了一套详细完整的文本数字水印算法实施方案,该方案具有良好的隐蔽性、安全性以及一定的鲁棒性。关键词,数字水印,中文字体,鲁棒性,嵌入中图分类号,TP,TP文献标识码,ADigitalWatermarkingAlgorithmBasedonChineseFontintheWordDocumentLVWeiFANGYongZHANGYeDENGYuanlinSHIXilin(CollegeofElectronicInformationSichuanUniversityChengduSichuanChina)Abstract,ThispaperanalysethsefeatureofdigitalwatermarkintgechnologyandtheexistentembeddingmethodsoftextdigitalwatermarkingAimingatChineseWorddocument,theembeddingmethoofdwatermarkingbasedonChinfoesnteisintroduced,anthdeprojectodfigitalwatermarkingalgorithmbaseondthatmethoidsdesignedThisprojecissafteandrobustKeywords,digitalwatermarking,Chinesefont,robustnessembedding,引言随着网络规模的不断扩大,网上各种数字化产品(如图像、视频、音频、文档等)的数量也急剧增加。开放性不断扩展的情况下,对数字化产品版权的保护显得日益迫切。数字水印技术是信息隐藏技术领域的支,是一种有效的数字产品版权保护和数据安全维护技术。该技术在数字化内容中嵌入不可察觉的信息,即并通过计算操作将其提取出来,从而起到保护数字作品版权或完整性的作用。但目前数字水印的研究主要图像与视频,针对文档的数字水印隐藏方式和算法的研究却较少。对于文本数字水印,文献提出了利拼音将文档进行分层,在各层中通过字符水平缩放嵌入水印的算法,文献提出了一种基于不完整语义水印算法,文献提出了利用内容和格式的统计信息来嵌入水印的算法。本文分析了数字水印技术的特点和现有文本数字水印的嵌入方式,针对现实中的中文Word文档,提种新的水印嵌入方式,并基于此方式设计了一套完整的文本数字水印算法实施方案,具有一定的实用性。数字水印技术数字水印的特点数字水印技术通过一定的算法将一些标志性信息直接嵌入到多媒体内容(如图像、文本、音频和视频数当中,水印的存在以不破坏原始作品的欣赏价值和使用价值为原则,一般来讲,数字水印应具有以下基本a)隐蔽性,指水印与原始数据紧密结合并隐藏其中,不影响原始数据的正常使用,b)鲁棒性,数字作品中的水印信息能够抵抗应用过程中的各种恶意或非恶意的操作,包括一般的信号几何变换,收稿日期,修回日期,d)确定性,数字水印所携带的版权信息能够被唯一确定地鉴别,e)易提取性,水印的嵌入和提取算法应简单。文本数字水印目前多数数字水印的研究和文献都与静止图像、视频的保护有关,对于文本水印的研究则较少,主要原因是数字文本没有像图像那样多的冗余信息,能嵌入水印信息的空间有限。很多用于图像水印的有效方法,并不适用于文本文档的规则结构。现在对文本水印的研究主要基于Brassil和Maxemchuk等人提出的在格式文本中嵌入水印的三种方案,行移编码、字移编码和特征编码。a)行移编码,通过将文本的某一整行垂直移动来嵌入水印。该过程检测水印时不需要原始文本参与,能够实现盲检测。但因为一行只能嵌入一个水印,导致文本所能携带的信息量很少。b)字移编码,通过将文本中的某些单词进行水平移动来嵌入水印。该方式能嵌入的水印信息较多,但由于在最初文档中的单词间距是不均匀的,所以在检测过程中需要原始文本的参与,不能实现盲检测。c)特征编码,通过改变某个单个字母的某一特殊特征来嵌入水印。它通过以文中未改变的字母作为参照,实现了盲检测。同时特征编码能嵌入较多的水印信息,因此目前对于文本水印嵌入的研究主要基于该方案,比如字母替换或改变字母的高度、大小等。但许多嵌入方式存在隐蔽性问题,在改变某些字体大小时,如果有一个与它相同的但未做变化的字母与它相邻,读者较易认出字母的变化。由于中文的复杂性,目前关于中文文本水印的论文较少,并且主要集中在如何提高水印嵌入算法的性能上,很少涉及完整的文本数字水印算法实施方案。本文根据数字水印技术的特点和文本数字水印的特征编码嵌入方式,针对常见的中文Word文档,设计了一套基于中文字体的文本数字水印算法,并提出一个相对完整的文本数字水印算法实施方案。基于中文字体的数字水印算法设计方案算法思想宋体字作为我国正式公文书写所要求的标准字体,一直以来也是人们书写中文文档的惯用字体Mic。rosoftWord除了常用的宋体字外,还提供了其他许多中文字体供用户使用,其中包括新宋体。实验表明,对任意一个相同文字(任意大小、颜色,或进行加粗、倾斜处理),宋体与新宋体的差别是人眼无法观察到的,如图所示。利用该特性,可规定文字字体为宋体时表示为编码“”,文字字体为新宋体时表示为编码,并根据生成的水印信息编码调节Word文档中部分中文的字体(由宋体改为新宋体或相反),从而“”实现水印信息的嵌入。数数字字水水印印数数字字水水印印数数字字水水印印数数字字水水印印FigComparisonbetweentwokindsoffont图两种字体比较水印生成算法a)确定欲隐藏的文本信息DD通常由数字、符号、英文字母和汉字(版本或序列号、所有者或公司名称)构成,根据原始文档和实际需要设计制定欲隐藏的文本信息。由于数字水印算法所能嵌入的二进制序列长度不能超过被嵌的原始文档长度,同时过长的水印信息会影响对提取后的水印信息纠错的性能,因此在格式文本中欲嵌入的文本信息D不宜过长,在此将D的长度选定为bit,即个字节,该长度足以嵌入欲隐藏的文本信息。b)RSA加密加密的目的在于即使水印信息被他人从文档中提取出,但没有私钥,提取者也不能明白水印的含义。在文本信息D制定完毕后使用RSA算法,用bit的公钥对D进行加密,生成密文D,由于RSA加密算法会把相同或不足密钥长度的明文数据加密成与密钥长度相同的密文,因此D数据的长度为bit,将D转化成二进制序列J,{j}(i=,,,)。ic)添加奇偶校验码二进制序列V=vvv,,v,当imod=时(每个数据位)添加一位校验位c,生成新序列V=vvvcvinkvcv,,vc。因此对密文序列J添加奇偶校验码时,需先将J扩展成bit(的整数倍),扩展位置填充nk进行添加形成新二进制序列J=jjjcjjcj,,jcjjc(j=j=j=)。新二进制的长度为bit。c=jj中含奇数个jk*k*k*kjjj中含偶数个c=*k*k*kkd)生成水印信息W计算原始文档中汉字个数T,再计算出整数m=T,对新序列J中每位进行次数为m的重复编码,形的水印信息W=jjjjjjccjj,,jjcc。水印信息W的长度为m*bit。m个m个m个m个m个m个m个水印嵌入算法提取水印信息jjjjjjccjj,,jjcc,并从原始文档起始处开始顺序扫描个汉字进行如下规则处理,汉字字体设置为新宋体W=i汉字字体设置为宋体通过检测W中每一位的值,变换字体,把原始文档转换成水印文本,水印嵌入过程如所示图。worddocumentworddocumentwithwatermarkembedwatermarkinformationflagRSAencryptwatermarkFigEmbeddingwatermark图水印嵌入水印嵌入的算法实现如下(Algorithm,EmbedWatermarking),Input,OriginalDocumentT,WatermarkWOutput,WatermarkDocumentTBeginfori=tom*doif(w=)theniTfontSetName()=T("宋体")修改文字字体endifif(w=)theniTfontSetName()=T("新宋体")endifTfontMoveNext移到下个文字endforReturnTEnd水印检测算法水印的提取实际上是水印嵌入的逆向过程,先计算水印文档中汉字个数T,再计算出整数m=T,始化一个长度为m*bit的二进制序列B。从水印文档起始处开始顺序扫描,检测每个汉字并对序列B进行则处理,数据块中包含大于m个b=i数据块中包含大于m个通过扫描每个汉字的字体,按规则得到二进制序列{b}(i=,,,n),将B划分成长度为m的个数据i从每块中按如下规则提取一位的a值,i汉字字体为新宋体时,i=ia=i汉字字体为宋体时i=i从序列B中提取出bit的A{a}后,对A按照每位再进行分块,进行奇偶校验,对奇偶校验有误的分i行比对分析,最终提取出二进制序列J=jjjj,将J转化成密文D,再使用RSA算法,用私钥对密文DiworddocumentwithwatermarkcheckwatermarkwatermarkinformationflagRSAdecryptFigCheckingwatermark图水印提取水印检测的算法实现如下,Algorithm,CheckWatermarking,,Input,WatermarkDocumentTOutput,WatermarkWBeginfori=tom*doif(TfontGetName()=T("宋体"))thenb=iendifif(TfontGetName()=T("新宋体"))thenb=iendifTfontMoveNext移到下个文字if(im=)thena=(bbb)(m)提取出aimimimiiendifendforJ=ParityCheck(A)奇偶校验检查W=RSA(J,PrivateKey)ReturnWEnd性能分析本文采用多个文档对该数字水印算法进行测试,在隐蔽性方面,如图所示,肉眼无法识别原始文档,左,与嵌入水印后的文档,右,的区别,因此该水印算法具有良好的隐蔽性。FigComparisonbetweendocumentsbeforeembeddedandafterembedded图水印嵌入前后的文档比对由于在算法设计中采用了RSA加密处理,因此该水印算法的安全性能基于RSA密码体制,而破译bit长度的密钥需要几天时间,从而使未经授权者不能轻易地伪造水印或检测出水印中的文本信息,并且数字水印所携带的信息能够被唯一确定地鉴别,所以该水印算法具有良好的安全性和确定性。设计方案中水印的嵌入和提取算法简单,具有易提取性,检测时无需原始文档,实现了盲检测。常见的格式调整,改变字体大小、字间距和行间robustness距,无法影响由该水印算法嵌入的水印,同时在算法设计中加入的奇偶校验编码和重复编码算法,在水印检测过程中能够发现并纠正误码。图是在一千左右字数文档中的一定数量随机位置上进行字体修改而numberofchangedcharactersFigGraphofrobustness造成正确检测水印概率的变化曲线图。如图所示,图鲁棒性曲线图该算法具有一定的鲁棒性,但是攻击者修改文档字体格式的数量越多,隐藏的文本信息恢复的可能性越小击者将文档内容复制到记事本或其他文本编辑器后再拷贝回来,文档所嵌入的水印信息将全部消失,这也法的最大问题。结论本文分析了数字水印技术的特点和现有文本数字水印的嵌入方式,针对现实中的中文Word文档,提种基于中文字体的水印嵌入方法,通过设置Word文档中汉字字体方式嵌入水印,并在此基础上设计了一完整的文本数字水印算法实施方案。该算法方案具有良好的隐蔽性、安全性以及一定的鲁棒性,具有一定价值。参考文献,鲁芳,孙星明基于汉语拼音的鲁棒性文本水印算法J计算机工程与设计,():,赵敏之,孙星明,向华政基于不完整语义理解的文本数字水印算法研J究计算机应用研究,():,胡晶晶,孙星明基于单词间字符统计特征的文本数字水J印计算机工程,():,BrassilJ,LowS,MaxemchuNF,ektalElectronicmarkingandidentificationtechniquetodiscouragsedocumenotcJIEEEJournalonSelAreainsCommun,():,廖继旺,孙洪淋用于Word文档认证的脆弱型数字水印算法J科学技术与工程,():,作者简介,吕伟(),男,四川省乐山市人,工),男,四川省西昌市人方勇(教授,主要研究方向为计算机网络与信息程师,年毕业于解放军理工大学通信工程学院,获学士学位,现为在读硕士研究生,主要主编过国家信息系统安全核心教程《信息系研究方向为网络与信息系统安全,Email:全》,qinqinhecom,邓远林(),男,湖南省常德市人张野(),男,成都市人,在读硕士读硕士研究生,主要研究方向为网络结构与研究生,主要研究方向为网络结构与信息安全,安全,石稀林(),男,湖北省黄冈人,在读硕士研究生,主要研究方向为网络结构与信息安全,

用户评价(0)

关闭

新课改视野下建构高中语文教学实验成果报告(32KB)

抱歉,积分不足下载失败,请稍后再试!

提示

试读已结束,如需要继续阅读或者下载,敬请购买!

文档小程序码

使用微信“扫一扫”扫码寻找文档

1

打开微信

2

扫描小程序码

3

发布寻找信息

4

等待寻找结果

我知道了
评分:

/11

基于中文字体的Word文档数字水印算法

VIP

在线
客服

免费
邮箱

爱问共享资料服务号

扫描关注领取更多福利