首页 面向数字版权管理的搜索引擎技术综述

面向数字版权管理的搜索引擎技术综述

举报
开通vip

面向数字版权管理的搜索引擎技术综述 225 面向数字版权管理的搜索引擎技术综述面向数字版权管理的搜索引擎技术综述面向数字版权管理的搜索引擎技术综述面向数字版权管理的搜索引擎技术综述 庄庄庄庄 超超超超 蒋文超蒋文超蒋文超蒋文超 (华中师范大学计算机科学系 武汉 430079) 摘摘摘摘 要要要要 怎样综合考虑互联网上有版权内容和无版权内容的综合查询 也即考虑如何在搜索引擎上增加权利管理的处理功能 这个问题体 现在数...

面向数字版权管理的搜索引擎技术综述
225 面向数字版权管理的搜索引擎技术综述面向数字版权管理的搜索引擎技术综述面向数字版权管理的搜索引擎技术综述面向数字版权管理的搜索引擎技术综述 庄庄庄庄 超超超超 蒋文超蒋文超蒋文超蒋文超 (华中师范大学计算机科学系 武汉 430079) 摘摘摘摘 要要要要 怎样综合考虑互联网上有版权内容和无版权内容的综合查询 也即考虑如何在搜索引擎上增加权利管理的处理功能 这个问题体 现在数字化图书馆 网络出版 远程教育以及企业内容服务等应用领域 该文主要介绍了 3种解决 方案 气瓶 现场处置方案 .pdf气瓶 现场处置方案 .doc见习基地管理方案.doc关于群访事件的化解方案建筑工地扬尘治理专项方案下载 面向水印机制的搜索引擎 搜索 引擎内嵌 DRM机制以及自动生成版权内容索引的外加 DRM搜索引擎机制 并对于这 3种解决方案做一个比较 关键词关键词关键词关键词 数字版权管理 搜索引擎 内容容器 Survey of Search Engine with Digital Rights Management ZHUANG Chao, JIANG Wenchao (Dept. of Computer Science, Central China Normal University, Wuhan 430079) Abstract How to integrate content seeking with copyright and content seeking without copyright Meanwhile, how to add digital rights management function into or onto search engine? This problem is a sub problem of digital rights management (DRM), which is used for digital library, network publication, telelearning and enterprise content service. This paper provides three solutions search engine for watermarked content, search engine with embedded DRM function and automatic search engine index generation for copyrighted content. At last, it gives a comparison of these three solutions. Key words Digital rights management; Search engine; Content container 计计计计 算算算算 机机机机 工工工工 程程程程 Computer Engineering 第第第第 32卷卷卷卷 第第第第 17期期期期 Vol.32 17 2006年年年年 9月月月月 September 2006 安全技术安全技术安全技术安全技术 文章编号文章编号文章编号文章编号 1000 3428(2006)17 0225 02 文献标识码文献标识码文献标识码文献标识码 A 中图分类号中图分类号中图分类号中图分类号 TP311 对于互联网有价值的数字内容如何管理相关的权利是 一个很重要的问题 因为它涉及到版权所有者是否将有价值 的内容放在互联网上 现在有多家公司和研究机构在开展数 字版权管理方向的研究[1] 其中最重要的是微软公司在数字 版权管理上安全可信基计算 计划 项目进度计划表范例计划下载计划下载计划下载课程教学计划下载 [4] 我们研究的问题是数字 版权管理这个大的问题范畴下面的子问题 怎样综合考虑互 联网上有版权内容和无版权内容的综合查询 也即考虑如何 在搜索引擎上增加权利管理的处理功能 这个问题体现在数 字化图书馆 网络出版 远程教育以及企业内容服务等应用 领域 对于数字化图书馆有公开的合理使用的免费服务图书 和期刊 也有需要权利管理的图书 对于网络出版和远程教 育中的 课件 超市陈列培训课件免费下载搭石ppt课件免费下载公安保密教育课件下载病媒生物防治课件 可下载高中数学必修四课件打包下载 提供需要有版权保护和查询计算的集中解决方 案 对于企业内容服务 企业数字化内容可以通过互联网有 偿给消费者 构成企业的赢利手段 这 4 个领域都涉及到搜 索机制与数字权利管理机制结合的问题研究 现在主要解决 方案有 3 种 基于拷贝检测的搜索引擎 搜索引擎内嵌 DRM 机制以及自动生成版权内容索引的外加 DRM搜索引擎机制 1 基于拷贝检测的搜索引擎基于拷贝检测的搜索引擎基于拷贝检测的搜索引擎基于拷贝检测的搜索引擎 水印是嵌入在数字视频 音频和图片中的一段肉眼看不 见的数字信息 当嵌入水印的数字内容放在互联网上的时候 搜索引擎可以搜索到这个数字内容并能提示相关的侵权信 息 在侵权的内容被搜索引擎搜索到以后 那么能够追踪到 相应的侵权的责任人的网站 从而可以追究相应的侵权责任 在这里需要一个数字权利的仲裁中心来确定权利人的利益 这在通过网站提供网络内容出版时 可以通过特定的搜索引 擎网站的信息服务提供集中的数字版权管理 如图 1 所示 A 网站提供有版权的内容 C 而 B 网站提供侵权的内容 C 通过带搜索引擎的 DRM 服务检索出相应的 B 网站的侵权 同时存在有直接对于网络网页的拷贝检测技术[10] 在 Google 的页面算法排序实现中考虑了拷贝检测的问题 对于重复出 现的网页会给出很低的排序值 以至于使得拷贝的文档根本 不能出现 图图图图 1 面向水印内容的搜索引擎的面向水印内容的搜索引擎的面向水印内容的搜索引擎的面向水印内容的搜索引擎的 DRM 服务服务服务服务 2 搜索引擎内嵌搜索引擎内嵌搜索引擎内嵌搜索引擎内嵌 DRM机制机制机制机制 数字版权管理系统 DRM 现在已经在互联网上广泛使 用 其基本的工作原理是将需要权利管理的数字内容加密或 者压缩打包成内容容器 用户得到内容容器之后 需要到网 络上的许可证服务器或者称为 DRM 服务器上取得解密密钥 以及相关的数字权利的描述 例如打印权利 播放权利 编 辑权利 转发权利等 用户在得到包含解密密钥和权利描述 的许可证之后 才能按照权利要求在可信环境内使用数字 内容[1] 一般的搜索引擎是通过一个网络蜘蛛自动访问互联网 并沿着任何网页中的所有 URL 找到所有的其它网页 重复 这一过程 并将找到过的所有内容收集到服务器上 由索引 作者简介作者简介作者简介作者简介 庄 超(1968 ) 男 博士 副教授 主研方向 数字权 利管理 DRM 网络安全 数字图书馆技术以及逆向工程与计算 系统生物学 蒋文超 硕士生 收稿日期收稿日期收稿日期收稿日期 2006-06-27 E-mail zhuang_chao@hotmail.com A 网站 B 网站 基于拷贝检测的搜索引擎服务 万方数据 226 系统程序对收集回来的所有内容进行分析 提取相关信息 并根据这些信息建立索引数据库 在用户输入关键词搜索后 由搜索系统程序从索引数据库中找到符合关键词的所有相关 内容 但是 在受 DRM 保护的内容在加密之后是一个封闭 的对象 搜索引擎在搜索到它后还是无法分析它 得到它的 相关信息 从而无法将它加入到索引目录数据库中 为了让 搜索引擎能够同样将受 DRM 保护的内容编制到索引中 就 必须使搜索引擎能够对这些加密的内容进行访问 为此 可 以考虑在搜索引擎中内嵌 DRM 机制 在搜索引擎中添加 一个 DRM模块 如图 2所示 图图图图 2 内嵌内嵌内嵌内嵌 DRM 机制的搜索引擎机制的搜索引擎机制的搜索引擎机制的搜索引擎 这个 DRM模块主要是用来和 DRM服务器进行联系 使 得索引程序能够像一个实际的终端用户一样 访问经过 DRM 加密的内容 从而将这些 DRM 保护的内容编制到索引中 为了区分索引程序和终端用户是谁在访问 DRM 搜索引擎 索引程序必须有一个能够被 DRM服务器识别的标志 当索引程序试图去索引所有内容 包括 DRM 加密的内 容时 索引程序是否能够访问这些加密的内容 取决于版权 所有者是否允许DRM服务器对搜索引擎中的DRM模块进行 授权 使 DRM服务器能够联合索引程序对 DRM 加密内容进 行访问从而对它进行索引 对于一个给定的内容文件 授权 包含了索引程序向 DRM 服务器请求并获得一个密匙 暂时 的解密内容 在索引完成后这个授权还会被收回 图图图图 3 局方式加密之前索引局方式加密之前索引局方式加密之前索引局方式加密之前索引 另外 为了使DRM模块与DRM服务器之间权利的授予 收回等消息具有统一性 可以对 DRM 服务采取一种统一工 作方式 可以采用一种在 DRM 服务器中加入索引服务的方 法 即将搜索引擎的索引技术和内容索引 记录 混凝土 养护记录下载土方回填监理旁站记录免费下载集备记录下载集备记录下载集备记录下载 的生成整合在 加密过程中 如图 3 所示 在内容所有者提交了要进行版权 保护的内容后 由 DRM服务器中一个 DRM 加密工具包在加 密之前对内容进行加工处理 索引记录包含对加密文件存储 位置的说明 以明文的形式提供给搜索引擎 并在搜索引擎 合成一个真正的完整的索引 整个电子发布的过程可以看成 索引 加密 发布到一个可以访问的位置 并由搜索引擎将 索引记录和存储位置合并成一个完整的搜索引擎索引 3 自动生成索引的外加自动生成索引的外加自动生成索引的外加自动生成索引的外加 DRM搜索引擎机制搜索引擎机制搜索引擎机制搜索引擎机制 由于内容容器被加密之后是一个封闭对象 搜索引擎难 以对于加密的数字内容进行搜索 因此对于数字内容容器有 一个自动生成索引的问题 如果先对内容进行一个索引自动生成的处理 然后将最 后得到的索引和加密过的内容进行打包处理 得到一个新的 内容容器 在这个内容容器中 原来的内容是加密的 不能 被未经授权的用户访问的 但最终索引是能够被任何人访问 的 这样任何一个内容的可能的购买者可以在仔细看了这个 内容的最终索引之后然后决定是否购买这个数字内容的某些 权利 例如浏览 打印 编辑等 外加 DRM 机制就是将得到的最终索引和加密原来文档 得到的加密文档进行打包处理 如图 4 所示 其中索引可以 加密也可以不加密 加密过后的最终索引表示只能被授权的 搜索引擎搜索到 但是没有加密的最终索引可以被任何的搜 索引擎搜索到 然后将 DRM 规则应用到打包之后的内容容 器 从而得到最后受 DRM 保护的内容 这里的内容容器包 内含有辅助的索引以核对文章的起源 对于索引加密可以确 保其完整性以防止被篡改 图图图图 4 外加外加外加外加 DRM 打包机制打包机制打包机制打包机制 4 带带带带 DRM的搜索引擎的比较的搜索引擎的比较的搜索引擎的比较的搜索引擎的比较 我们对于这 3 种带 DRM 的搜索引擎机制进行一个比较 如表 1 表表表表 1 带带带带 DRM 的搜索引擎的对照表的搜索引擎的对照表的搜索引擎的对照表的搜索引擎的对照表 基于拷贝检测 内嵌 DRM 外加 DRM 灵活性 强 弱 弱 复杂度 大 小 小 安全性 较好 好 差 易建立性 较易 最难 最易 适用面 较广 最广 较差 下转第 229页 编制索引 加密/签名 发布地点 索引器与加密工具包 Web server DRM server Index Search engine Index 普通 文件 用户 查询 Search Indexer or Crawler DRM module Internet/ Intranet 请求 DRM server 加密 文件 WebServer 普通 文件 Index Key 加密 加密文档 加密 打包处理 加密文档和最终索引 DRM 规则应用 DRM 包 文档 最终索引 万方数据 229 理业务 中间任何环节的错误都将使本次 Web Service 调用 产生异常 加密设备 客 户 端 HTTP 代理 安 全 扩 展 压 缩 扩 展 压 缩 扩 展 安 全 扩 展 Web 服务 器插 件 通信网络 压缩 加密设备 应用 W eb 服务 还原 的 S O A P 原 S O A P 图图图图 1 可信高性能的可信高性能的可信高性能的可信高性能的 Web Service 模型模型模型模型 服务器的应答 SOAP也将类似处理 不再赘述 3 平台无关和应用透明的实现平台无关和应用透明的实现平台无关和应用透明的实现平台无关和应用透明的实现 最后给出一个具体实现的方式 当今两大主流的平台 J2EE 和.NET 都对 Web Service 有很好的支持 微软的.NET 对于 SOAP扩展进行了比较好的设计 允许在 SOAP 序列化 操作时按需要加入 SOAP 扩展 本文中提到的两种扩展都可 以用这种方式嵌入.NET 中 实际上 微软也提供了一个安全 的解决方案 Web Service Enhancements 通过 SOAP 扩展增 强 Web Service 的安全性 当然 仅仅是安全 没有达到可 信的程度 但是 考虑到通用性 实现要求做到平台无关 无论 J2EE 还是.NET 都可以以相同的方式实现 也不受 J2EE .NET 互 操作性的影响 因此不采用微软的解决方案 在实现时 使用客户端 HTTP 代理加服务器端 Web Server 插件的技术来做到平台无关 客户端 HTTP 代理可以 屏蔽浏览器 应用程序的差异 只要是 HTTP 协议 离婚协议模板下载合伙人协议 下载渠道分销协议免费下载敬业协议下载授课协议下载 通过代 理都能得到 Web Service 调用时的原始 SOAP 包 基于此 SOAP包 可以加入两个扩展 服务器端 主流的 Web Server 一般都提供插件机制 允许在客户端的 HTTP 请求上送到应 用程序前处理 HTTP数据包 这样插件就能完成解压 解密 验证 还原 SOAP的工作 采用这种实现方式 对应用程序也做到了完全透明 应 用开发调用 Web Service 的方式与原来完全相同 不需要做 出任何额外的努力 已有的应用不需要修改 通过一些配置 就能自动升级成可信高性能的 Web Service 可见 这是一种 比较好的实现方案 4 结论结论结论结论 本文提出了一种可信高性能的 Web Service 处理模型 通过将 PKI技术 数据压缩技术与 Web Service技术的结合 有效地解决了 Web Service 的安全性和性能的问题 并且给 出了一种平台无关 应用透明的实现方式 有比较好的应用 前景 参考文献参考文献参考文献参考文献 1 Bartel M, Boyer J. XML-signature Syntax and Processing[Z]. W3C Proposed Recommendation 20, http://www.w3.org/TR/2001/PR- xmldsig-core-20010802, 2001-08. 2 XML Encryption Syntax and Processing. W3C Candidate Recommen- dation[Z]. http:/www.w3.org/TR/2002/CR-xmlenc- core -20020802, 2002-08-02. 3 Atkinson B, Libera G D. Web Services Security(WS-Security) Version 1.0[Z]. http://www.ibm.com/developeworks/library/ws-secure, 2002- 04-05. 4 Box D, Ehnebuske D. Simple Object Access Protocol (SOAP) 1.1[Z]. W3C Note, http://www.w3.org/TR2000/NOTE-SOAP-20000508, 2000-05-08. 5 Gailey J H. Encrypting SOAP Messages Using Web Services Enhancements[Z]. http://msdn.microsoft.com/library/default.asp?url= library/enus/dnwse/html/wseencryption.asp, 2003-03. ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 上接第 226页 5 结论结论结论结论 对于面向数字版权管理的搜索引擎技术作了一个详细的 综述 基于拷贝检测的搜索引擎机制 内嵌 DRM 的搜索引 擎机制以及外加DRM的搜索引擎机制作了详细介绍和比较 这项工作的深入研究将有助于互联网上的数字化图书馆 网 络出版 远程教育以及互联网企业内容服务的版权内容查询 参考文献参考文献参考文献参考文献 1 庄 超. 一种新型 Internet内容版权保护的计算机制[D]. 北京: 中 国科学院计算技术研究所, 1999-12. 2 Olin S. Securing the Content, Not the Wire, for the Information Commerce[Z]. http://www.intertrust.com. 3 Koch E. Copyright Protection for Multimedia Data[C]. Proc. of the International Conference on Digital Media and Electronic Publishing, 1994: 6-8. 4 Microsoft Palladium. Trusted Computing[Z]. http://www.microsoft. com. 5 Roscheisen D M. A Network-centric Design for Relationship-based Rights Management[D]. Stanford University, 1997-12. 6 Goldstein P. Copyright’s Highway: The Law and Lore of Copyright from Gutenberg to Celestial Jukebox[M]. New York: Hill and Wang, 1994. 7 Stefik M. Letting Loose the Light: Igniting Commerce in Electronic Publishing, Draft[Z]. Xerox PARC, CA., 1995. 8 Stefik M. The Digital Property Rights Language, Manual and Tutorial[Z]. Xerox PARC: CA., 1996. 9 Choudhury, Maxemchuk. Copyright Protection for Electronic Pub- lishing over Computer Networks[EB/OL]. ftp://ftp.research.att. com/dist/anonce/copyright.epub.ps.z. 10 Shivakumar N. SCAM: A Copy Detection Mechanism for Digital Documents[C]. Proc. of DL, 1995. 万方数据 面向数字版权管理的搜索引擎技术综述 作者: 庄超, 蒋文超, ZHUANG Chao, JIANG Wenchao 作者单位: 华中师范大学计算机科学系,武汉,430079 刊名: 计算机工程 英文刊名: COMPUTER ENGINEERING 年,卷(期): 2006,32(17) 参考文献(10条) 1.Choudhury Maxemchuk Copyright Protection for Electronic Pub-lishing over Computer Networks 2.Stefik M The Digital Property Rights Language,Manual and Tutorial 1996 3.Stefik M Letting Loose the Light:Igniting Commerce in Electronic Publishing,Draft 1995 4.Goldstein P Copyright's Highway:The Law and Lore of Copyright from Gutenberg to Celestial Jukebox 1994 5.Roscheisen D M A Network-centric Design for Relationship-based Rights Management 1997 6.Microsoft Palladium Trusted Computing 7.Koch E Copyright Protection for Multimedia Data 1994 8.Shivakumar N SCAM:A Copy Detection Mechanism for Digital Documents 1995 9.Olin S Securing the Content,Not the Wire,for the Information Commerce 10.庄超 一种新型Internet内容版权保护的计算机制[学位论文] 1999 本文链接:http://d.g.wanfangdata.com.cn/Periodical_jsjgc200617079.aspx
本文档为【面向数字版权管理的搜索引擎技术综述】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_155956
暂无简介~
格式:pdf
大小:591KB
软件:PDF阅读器
页数:0
分类:互联网
上传时间:2012-05-24
浏览量:26