首页 建设NSTL回溯数据服务系统,提升国家战略文献资源保障能力

建设NSTL回溯数据服务系统,提升国家战略文献资源保障能力

举报
开通vip

建设NSTL回溯数据服务系统,提升国家战略文献资源保障能力建设NSTL回溯数据服务系统,提升国家战略文献资源保障能力 建设NSTL回溯数据服务系统,提升国家战略文献资 源保障能力 张智雄 黄永文 谢靖 钱力 刘建华 (北京 中国科学院国家科学图书馆 100190) 乔晓东 毕军容 梁冰 郝春云 王莉 吕世炅 周志奇 (北京 中国科学技术信息研究所 100038) 摘要:为了提升国家战略文献资源保障能力~NSTL建设了NSTL回溯数 据服务系统。文章主要从回溯数据服务系统建设的背景、系统定位、功 能设计、系统部署、应用实现以及主要特点等几个层面详细论述~突出 展...

建设NSTL回溯数据服务系统,提升国家战略文献资源保障能力
建设NSTL回溯数据服务系统,提升国家战略文献资源保障能力 建设NSTL回溯数据服务系统,提升国家战略文献资 源保障能力 张智雄 黄永文 谢靖 钱力 刘建华 (北京 中国科学院国家科学图书馆 100190) 乔晓东 毕军容 梁冰 郝春云 王莉 吕世炅 周志奇 (北京 中国科学技术信息研究所 100038) 摘要:为了提升国家战略文献资源保障能力~NSTL建设了NSTL回溯数 据服务系统。文章主要从回溯数据服务系统建设的背景、系统定位、功 能 设计 领导形象设计圆作业设计ao工艺污水处理厂设计附属工程施工组织设计清扫机器人结构设计 、系统部署、应用实现以及主要特点等几个层面详细论述~突出 展现了系统的易用性、安全性和大规模并发的支持能力~并对NSTL回 溯数据服务系统的开发模式、技术路线等给予了总结。 关键词:NSTL~回溯数据~战略文献~资源保障 1引言 国家科技图书文献中心(NSTL)经过多年的建设和发展,逐步建立起以资源为基础,以网络信息技术为支撑,以服务用户为中心的网络科技文献信息服务系统,逐步发展成为一个在国内受到高度赞誉,在国际具有一定影响的现代科技文献信息服务机构。 为了实现对人类重要科研成果的有效收集、保存、管理和利用,解决我国外文科技期刊历史性缺失的问 快递公司问题件快递公司问题件货款处理关于圆的周长面积重点题型关于解方程组的题及答案关于南海问题 ,提升NSTL国家科技文献资源战略保障的能力,为全国科技界、文献情报机构提供重要科技全文战略资源的服务保障,打破我国科学界严重依赖于国外服务商提供全文数字资源保障的危险情况,近年来,NSTL一直将“购买国外高水平科技出版社的回溯全文数据资源到中国,并通过自己的服务平台构建面向全国科技界的回溯全文检索获取服务”作为一个重要的战略举措加以执行。 2008年5月,NSTL正式与施普林格(Springer)出版社签署了Springer回溯数据库(OAC)的全国购买协议。根据协议规定,Springer回溯数据库(OAC)从2008年到2011年底,可以通过Springer的软硬件平台向全国提供服务,但自2012年起Springer回溯数据库(OAC)的网上服务需要迁移到NSTL自己开发的软硬件系统平台之上。2009年,NSTL又先后与OUP(牛津大学出版社)、 IOP(英国物理学会)、Nature(Nature出版集团)几家出版机构签署了回溯数据库购买协议,购买了这些出版社的回溯数据库,所购买的回溯数据库当时都只能通过各数据库提供商自己的服务平台为国内用户提供服务。 在这种形势下,2009年NSTL部署了“NSTL回溯数据服务系统”建设项目,项目的目标是通过两年的时间,建立起NSTL的回溯数据服务平台,并通过这一平台,激活这些已经购买的回溯数据库资源,将NSTL购买的回溯数据资源作为国家战略资源对外提供服务,使国内非盈利机构能够有效地检索、浏览、下载和利用这些回溯数据资源,实现对回溯数据资源的有效利用、管理和保存。 在NSTL领导的推动下,NSTL网络工作组构建了由中国科学院国家科学图书馆、中国科学技术信息研究所和NSTL办公室相关人员组成的项目组,承担起了NSTL回溯数据服务系统的建设任务。 2系统建设要求和定位 作为NSTL这样一个国家战略文献资源服务平台中一个重要的子系统,NSTL回溯数据服务系统的建设,并不是一个孤立系统的建设,它需要能够有机融入NSTL的整体服务系统,有效支撑NSTL的战略发展目标,有力支持全国科技界、全国文献情报机构对这些重要科技全文战略资源的服务需要。 总体而言,NSTL回溯数据服务系统的建设,需要适应当前技术发展的趋势,选择和利用成熟技术,依据NSTL总体服务系统的框架,构建NSTL回溯数据的全文下载和利用平台,实现NSTL回溯数据平台与当前的NSTL网络服务系统、NSTL引文服务系统等系统的有机集成,保证NSTL回溯数据被合理有效、方便快捷地利用。 具体而言,NSTL回溯数据服务系统的建设需要:(1)构建具有NSTL回溯数据的检索、浏览、全文下载和利用的回溯数据服务平台,实现回溯数据的有效利用。系统需要提供会话(Session)管理功能,提供相关授权功能和合理使用监测;系统需要提供检索功能,提供导航性浏览(Guided Browsing)功能,能够按用户习惯的方式进行回溯数据的检索和浏览;系统需要支撑回溯数据库中资源层次及相关关系的有效组织和揭示;系统需要提供开放检索接口、开放定位接口、开放链接等接口,能够将本系统相关功能有机嵌入到NSTL及其它文献服务机构的系统之中;(2)实现与相关平台的有机集成,有效支持国内相关文献情报机构的相关服务。NSTL回溯数据服务系统应当是一个能够嵌入NSTL服务平台的回溯数据服务平台,能够将回溯数据的检索和全文保障有效集成在NSTL网络服务的整体框架之下。NSTL回溯数据服务系统应当是一个开放系统,能够支持其它图书馆系统实现对资源的有效定位,实现对国内有关文献情报机构的支持;(3)实现回溯数据服务资源的有效管理、保存和利用。系统能够实现对多种回 溯数据库资源(Springer、OUP、IOP等资源)的有效管理,能够提供按资源来源分包的服务方式。系统需要遵循知识产权管理,能够根据每一个资源包的许可情况,对资源进行合理使用。系统要支持用户下载量、使用量的统计和监测。 基于上述要求,项目组提出了NSTL回溯数据服务系统的建设定位。项目组认为NSTL回溯数据服务系统:(1)是一个具有独立的回溯数据检索、浏览、揭示、下载功能的服务平台,保证NSTL回溯数据合理有效、方便快捷地利用;(2)是一个能够实现对NSTL回溯数据库资源进行有效管理和保存的平台;(3)是一个具有开放接口的回溯数据服务平台,开放检索接口、开放定位接口、开放链接接口能够将本系统相关功能有机嵌入到其它系统之中;(4)是一个与NSTL相关系统和服务无缝集成的平台,能够实现与当前的NSTL网络服务系统、NSTL引文服务系统等系统的有机集成;(5)是一个能够有效与其它第三方系统集成的平台,通过开放接口,能够对国内文献情报机构的回溯数据提供有效支撑和保障;(6)是一个在当前网络环境下,能够方便用户应用,能够有效嵌入科研人员数字空间的服务平台。 3 NSTL回溯数据服务系统的整体设计 按照NSTL回溯数据服务系统的建设要求,NSTL回溯数据服务系统的设计充分考虑了NSTL回溯数据的服务和应用场景设计,系统的功能框架设计充分考虑了用户需求和当前技术的发展发向,系统软硬件部署设计充分考虑了大规模并发用户的检索和访问压力。 3.1服务和应用场景设计 NSTL回溯数据服务系统的建设,必须充分考虑与其它NSTL其它系统(NSTL三期网络服务系统、NSTL引文数据库系统、MyNSTL等相关NSTL系统)、第三方图书情报机构、Google Scholar、 Baidu等搜索服务提供商、相关图书馆的Webpac、读者、管理员、Delicious、CiteUlike、MySpace等用户Web 2.0空间的相关关系。 NSTL回溯数据服务系统的服务和应用场景如图1所示。 图1 NSTL回溯数据服务系统的服务和应用场景 在NSTL的众多服务系统之中,NSTL回溯数据服务系统需要重点实现与NSTL网络服务系统和NSTL引文数据库系统的有机集成。NSTL回溯数据服务系统的检索功能需要有机集成到NSTL的三期网络服务系统之上,让读者可以在NSTL网络服务系统之中检索到回溯数据,并通过NSTL三期网络服务系统将用户的全文下载指向回溯数据服务系统。NSTL回溯数据服务系统需要实现与NSTL引文数据库的有效集成,能够从引文数据中链接到NSTL回溯数据库资源,使研究人员可以快速获取到相关资源。相应地,在回溯数据服务平台之上,也需要能够通过引文库系统,获知某条回溯数据的被引用情况,以更有效的推荐回溯数据资源的应用。 NSTL回溯数据服务系统需要通过开放接口实现与其它第三方系统的集成。NSTL回溯数据服务系统的建设需要支持开放检索、开放资源定位和开放链接接口。可以让第三方系统按照相关 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 能够有效检索、定位和集成NSTL回溯数据服务系统,实现对国内有关文献情报机构的支持。 3.2系统的功能框架设计 NSTL回溯数据服务系统依据NSTL总体服务系统的框架,构建NSTL回溯数据的全文利用以及数据管理平台,实现NSTL回溯数据平台与当前的NSTL网络服务系统的有机集成,以及与第三方机构、最终用户的有机融合。系统的总体功能框架如图2所示,系统主要分为六大功能,具体如下: 图2 NSTL回溯数据系统的总体功能框架图 (1)面向用户的回溯数据服务平台。提供检索功能,能够按用户习惯的方式进行回溯数据检索查询;提供导航性浏览功能,支持按期刊字顺、数据库商等多种方式组合的浏览;支持降落页(Landing Page)功能,对于期刊、丛书、论文都有一个唯一的定位标识,可以及时定位到相应的降落页上;支持回溯数据资源层次及相关关系的有效揭示,能够明确按期刊、卷、期、文章的次序浏览和组织期刊论文;提供基于Session的会话管理功能,能够对访问系统的用户进行身份识别,提供相关授权功能。 (2)面向数据的的回溯数据管理和保存平台。支持多种类型文献数字资源(期刊论文、丛书)的管理,支持对资源的批量操作和管理,并提供扩展功能和有效机制,能够方便地将NSTL继续购买的回溯数据库纳入其中;提供实时的监测功能,能够及时有效发现用户的非正常使用,并当即采取措施,及时杜绝非法使用和恶意下载的情况发生;提供长期的数据统计、跟踪分析功能,能够对数据使用情况提供支持。 (3)开放的回溯数据服务接口。提供开放检索接口、开放定位接口、开放链接接口等开放接口,能够将本系统的相关功能有机嵌入到NSTL及其它文献服务机构的系统之中;支持开放的资源定位,如期刊定位,文章定位,按照相关标准,让NSTL系统或其它图书馆系统有效定位他们所需资源,实现对国内有关文献情报机构的支持。 (4)实现与NSTL相关系统和服务无缝集成,特别是实现与NSTL服务系统、NSTL引文数据库系统、MyNSTL等相关NSTL系统的集成。实现与NSTL网络服务 系统的检索功能有机集成,在NSTL网络服务系统之中可以揭示回溯数据和检索到回溯数据;实现与NSTL引文数据库的有效集成,从引文数据中链接到NSTL回溯数据库资源,使研究人员可以快速获取到相关资源。 (5)嵌入其它图书情报机构。通过开放接口,实现与这些机构检索、获取服务的有效集成,对国内文献情报机构的回溯数据服务提供有利的支撑。支持元数据的开放,如开放给Google Scholar等,提供从其它来源(如其它OpacWeb)的检索接入。 (6)嵌入用户Web 2.0空间。实现有效嵌入到科研人员的Delicious、CiteUlike、Myspace等Web 2.0空间,帮助用户不断构建适合自己需要的个人网络学习资源环境,做到真正融入到用户的学习环境和科研环境中去。 3.3系统软硬件部署设计 作为NSTL的一个国家级战略文献资源服务平台,NSTL回溯数据服务系统的软硬件部署设计充分考虑了大规模并发用户的检索和访问压力。 NSTL回溯数据服务系统的软硬件部署设计采用分布式企业级架构,除了多机负载均衡之外,还将各种业务功能分配到不同的职能计算机上,实现多机的协调工作,极大地提高了服务器集群服务能力。 具体而言,NSTL回溯数据服务系统的硬件平台由2台负载均衡器、2台Web服务器、2台全文索引服务器、1台数据库服务器、1台下载服务器、1台管理服务器、1台备用服务器和相应的存储系统组成。系统的总体部署图如下: 内部网络 对外开放网络 索引服务器 Web服务器 负载均衡 索引服务器 用户Web服务器 负载均衡(热备)磁盘阵列 数据库服务器 备用服务器 下载服务器 管理员 管理服务器 图3 系统软硬件部署图 其中,负载均衡器负责接收并分发用户的Web请求;Web服务器部署回溯数据应用系统,为用户提供回溯平台的Web服务;索引服务器上部署回溯数据的全文索引,对外提供快速的分面检索服务;数据库服务器存储回溯数据的元数据,提供期刊文献的浏览和导航功能;下载服务器对用户的访问权限进行认证,并为有权限的用户提供回溯数据全文的下载服务;磁盘阵列安全保存回溯数据的所有PDF全文文件;管理服务器让管理员通过内部网络对回溯数据服务平台进行管理和监控;备用服务器则在访问量过高的时候,共同分担访问压力,扩充服务能力。 当用户访问NSTL回溯数据服务系统之时,先由负载均衡器将用户请求分发到Web服务器上;用户的检索请求由Web服务器发送到索引服务器上;当查找到用户需要的文档,检索服务器与数据库服务器通过ID号与数据库服务器建立关联,当查找到用户需要的文档,通过ID号从数据库服务器找到该文档的详细信息和文档的下载地址。当有权下载回溯全文的用户需要下载全文数据的时候,下载服务器生成一个临时的URL,供用户下载全文。 该部署设计 方案 气瓶 现场处置方案 .pdf气瓶 现场处置方案 .doc见习基地管理方案.doc关于群访事件的化解方案建筑工地扬尘治理专项方案下载 让各种职能服务器的有机组组合、相互协调,将用户的访问压力分摊在不同的服务器上,提高系统的承载力。通过第三方组织的系统性能测试,NSTL回溯数据服务系统能够稳定有效地支持高达400名用户的并发访问。 4 NSTL回溯数据服务系统的实现情况 目前,NSTL回溯数据服务系统的开发工作已经完成,系统已经在2010年5月上线提供正式服务,系统采取IP地址认证方式,为我国大陆学术型、非商业性用户提供免费在线使用,提供回溯数据的检索、浏览、揭示、下载等服务,实现了NSTL回溯数据库资源有效管理和保存。在建设NSTL回溯数据服务系统的过程中,力求保证系统的稳定性、快速性、可用性,同时还考虑与NSTL三期改造项目的一致性,如界面整体风格、期刊分类标准等。下文主要介绍回溯数据资源情况、前台服务系统和后台管理系统的实现情况。 4.1回溯数据资源的基本情况 NSTL回溯数据服务系统包括了NSTL购买的Springer、OUP、Nature、IOP、Turpion五家出版社的1122种期刊、325万篇全文回溯数据。此外,NSTL与其他回溯数据库商的购买协议还在洽谈中,回溯数据还将不断增长。 目前,Springer回溯数据涵盖自然科学、医学、商业、技术、建筑和运输六个主要领域,包括910种期刊,13万余期。OUP回溯数据主要覆盖数学和物理、医学、生命科学、社会科学、人文科学、法律等领域,包括138种期刊,2.2万余期。Nature周刊是生物学及物理学等自然基础科学各学科领域的核心刊物,包括6100多期。IOP回溯数据覆盖物理、数学、计算机科学、凝聚态和材料科学、测量科学和传感器、医学和生物学等,包括61种期刊,1万余期。Turpion回溯期刊数据涵盖物理、数学和化学方面最顶尖的研究论文,包括12种期刊,2100多期。数据具体情况见表1。 表1 NSTL回溯数据服务系统目前包括数据的基本情况 出版社 期刊种数 数据起止年代 篇数 Springer 910 1854-1996 1,923,500 OUP 138 1849-1995 820,963 Nature 1 1869-1996 291,674 IOP 61 1874-2002 192,203 Turpion 12 1958-2002 29,608 总计 1122 3,257,948 4.2用户服务系统的实现 NSTL回溯数据的前台用户服务系统主页见图4。在NSTL回溯数据服务系统的建设中,应用了先进的分面检索技术,支持所有数据库的统一检索,提供按数据库、年代、期刊、作者的分面导航(见图5),帮助用户快速定位到所需的文献全文。系统提供快速检索和高级检索两种入口,支持模糊检索(同义词或者同词根)、精确检索、短语检索以及逻辑组配操作(and, or)检索。系统支持对所有 回溯期刊的字顺浏览和学科分类浏览,并提供浏览与检索相结合的功能。同时为了保证原数据库系统的用户使用习惯,还专门提供了5家数据库系统的高级检索和期刊浏览功能,尽量保持原系统的功能和界面布局特点,以方便用户使用。 图4 NSTL回溯数据的前台用户服务系统主页 图5 检索结果的分面导航界面 4.3后台的管理系统 后台管理系统实现了统计管理、监测管理、日志管理、用户管理、数据库管理和系统用户管理。面向机构用户,提供全文下载权限的开通及禁止功能。实现了对期刊利用情况(见图6)、机构使用情况、检索历史、数据库利用情况和在线期刊文献的统计功能,支持Counter统计标准,提供统计报告的浏览和下载(PDF、Excel)。系统还对访问NSTL回溯数据库服务系统的用户操作进行全面的记录,支持对用户在线情况、非法下载情况进行实时监测,可以监测到用户短时间内的批量下载行为以及监测用户批量获取文献行为。 图6 期刊使用情况统计结果界面 5 NSTL回溯数据服务系统的主要特点 综观NSTL回溯数据服务系统,项目组认为此系统主要有以下特点。 (1)NSTL回溯数据服务系统的建设创新性地利用了分面检索技术。这一索引技术在处理海量数据、支持大规模并发用户方面是相当有效的。NSTL回溯数据服务系统的分面检索,可以对检索结果提供按数据库、出版年代、期刊种类和主要作者的分面导航浏览功能,可以有效地、直观地、帮助用户缩小和放大检索结果的范围。 (2)为了让习惯于应用原数据库系统界面的用户更好地使用NSTL购买的回溯数据,NSTL回溯数据服务系统的建设按数据的来源分别构建了仿Springer、OUP、Nature、IOP、Turpion等系统平台服务界面的单库检索浏览系统,尽量保 持NSTL单库检索浏览系统与原系统平台的功能和界面布局相似,以方便用户使用。 (3)链接导航动态灵活。在用户访问系统过程中,系统记录了用户的浏览和检索路径,无论用户处于哪个页面,都可以借助系统的链接导航功能,方便地返回到用户曾经访问过的页面。这一功能体现了系统的人性化和亲和力。 (4)实现了全面的基于会话的日志管理。在用户使用系统过程中,系统记录了用户的所有的检索和浏览等操作,在尊重用户隐私的前提下,有利于进一步的用户分析与数据挖掘。并在此基础之上支持多重下载控制和非法使用监控,防止用户的恶意下载行为,保护回溯数据的安全利用。 (5)统计角度灵活多样,统计标准通用 规范 编程规范下载gsp规范下载钢格栅规范下载警徽规范下载建设厅规范下载 。NSTL回溯数据服务系统从期刊名、期刊所属学科分类、数据库商、机构所属行业等不同的角度,提供了灵活多样的统计。统计支持Counter标准,有利于为数据库商和机构用户提供资源使用统计数据,便于统计数据的交换和利用。 6结束语 NSTL回溯数据服务系统整个建设过程中均严格按照软件工程的要求来建设,在系统设计、软件开发、系统测试等多个环节中,都得到用户专家组的积极参与和支持。系统在推出之前,经过了严格的第三方功能测试和性能测试,通过了由NSTL服务工作组组织的用户测试,并通过了国家信息安全中心组织的安全测试,达到了国家信息系统的2级安全保护等级要求。 从目前来看,系统的可用性、易用性、可靠性、安全性和大规模并发支持能力等各个方面都达到了预期的设计目标。在建设过程中,项目组认为在开发模式、采用的技术路线等方面是值得肯定的,在今后的项目建设中可以借鉴: (1)由成员单位相关技术力量组成的自主开发模式值得肯定。NSTL回溯数据服务平台项目组由中国科学院国家科学图书馆、中国科学技术信息研究所和NSTL办公室相关人员组成,实现了团队成员的优势互补,在不到一年的时间中里完成了这一系统的开发,达到了运行要求,应当说这一自主开发模式是相当成功的。 (2)项目组探索并熟练掌握了先进的分面索引技术。通过实践证明,这一索引技术在处理海量数据索引、快速检索结果响应、并发大规模检索方面是相当有效的。而这一索引技术的分面检索导航的能力以及分布式部署方式,更为其它检索引擎所不能及,值得在今后相关项目中加以推广和更深入应用。 (3)NSTL回溯数据服务系统的建设,采用了以PC服务器为硬件平台,以Linux及相关开源软件为支撑的系统体系架构,经过测试,这一系统体系架构 能够支撑起NSTL这样大规模的海量应用,并且能够很大程度地降低成本。 致谢 在NSTL回溯数据服务系统的建设和本文的撰写过程中,得到了NSTL领导袁海波主任、吴波尔副主任、沈仲祺副主任、NSTL网络系统部胡铁军老师、NSTL资源建设部郑建成老师、梁芳老师、NSTL服务工作组蔡志勇老师等同仁的大力支持,在此一并致谢。
本文档为【建设NSTL回溯数据服务系统,提升国家战略文献资源保障能力】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_531654
暂无简介~
格式:doc
大小:180KB
软件:Word
页数:15
分类:初中语文
上传时间:2017-09-26
浏览量:24