首页 一种快速的XML语义检索算法

一种快速的XML语义检索算法

举报
开通vip

一种快速的XML语义检索算法 第 ll期 2OO7年 l1月 电 子 学 报 A( A ELECTRONICA SiNICA v01.35 No.11 Nov. 砌 一 种快速的XML语义检索算法 李新叶,苑津莎 (华北电力大学电子与通信工程系,河北保定 071~3) 摘 要: 传统基于关键词的搜索引擎不能充分利用XML文档的结构信息,搜索结果往往不精确;而基于结构信 息和关键词的XML搜索技术又不适用于普通用户.基于关键词的XML语义检索克服了以上缺点,但需要提高检索效 率.本文深入分析了XML文档结构...

一种快速的XML语义检索算法
第 ll期 2OO7年 l1月 电 子 学 报 A( A ELECTRONICA SiNICA v01.35 No.11 Nov. 砌 一 种快速的XML语义检索算法 李新叶,苑津莎 (华北电力大学电子与通信工程系,河北保定 071~3) 摘 要: 传统基于关键词的搜索引擎不能充分利用XML文档的结构信息,搜索结果往往不精确;而基于结构信 息和关键词的XML搜索技术又不适用于普通用户.基于关键词的XML语义检索克服了以上缺点,但需要提高检索效 率.本文深入分析了XML文档结构潜藏的语义,提出了新的索引结构及两结点语义相关的判断函数,在此基础上提出 了一种快速的XML语义检索算法,该算法大大减少了结点对语义相关的判断次数.对实际数据集的测试实验结果显 示出新算法的有效性. 关键词: XML文档;语义检索;索引结构;信息检索 中图分类号: TP391 文献标识码: A 文章编号: 0372-2112(2007)11-2220-06 A Fast Semantic Se arch Algorithm for XML Data U Xin—ye.YUAN Jin—sha ( ofElectronic and Communication Engineering,North China Electric Power University, ,Hebe/071003,Ch/na) Abstract: Traditional keyword-based search engine does not consider the additional information provided bv the sInK缸 of XML documents,it returns i1】 results often;searching acc(玳|iI培 to keywords and 山re information of XML doo.m~nts inputtedis not suitableforcomiilonusels.Semantic searchfor XML databasedon tag_一l~ywordso、,I 。0《nesthelimitations above, but its efficiency needs to be improved.This paper analyzes semantic information provided by the smJc山re of XML dclclm瑚 ts deeply.It puts forward a I跏 index sInlcn】l℃for XML data and semantic relaled decision function between tw o nodes.Based on this.it proposes a fast se~.antic search algorithm for XML d..a.t—a..The search algorithm reduces the times to decide semantic cormla. tion greatly.The experimental results with real dam sets illumam the effectiveness of the proposed algorithrn. Key words: XM doctmaent;semantic search;index structure;information retrieval 1 引言 XML由于具有 自描述、灵活的数据结构及丰富的 数据表示能力等特点,现已被广泛应用到电子商务中数 据的表示、数据集成,信息检索等领域,并逐步成为 In. temet/intranet上数据交换的标准.针对 web上出现的越 来越多的XML文档,传统的基于关键词的搜索引擎由 于未考虑到XML文档结构隐藏的语义,搜索结果往往 不精确. 近年来,已有许多针对 XML文档的搜索及索引的 研究 1 J,需要用户输入 XML文档结构信息以获得精 确的检索结果,而普通用户往往不知道 XML文档的结 构(路径)信息,因此这些 方法 快递客服问题件处理详细方法山木方法pdf计算方法pdf华与华方法下载八字理论方法下载 不适用于普通用户的检索 要求.XML文档查询语言XQtr~v也不适用于 XML搜 索引擎,主要原因有 8J:(1)语法复杂;(2)需要知道文档 的结构来构造一个查询语句;(3)没有查询结果的排序; (4)查询速度慢.文献[8]提出了一种基于关键词的适用 收稿日期:2007-03-12;修回日期:2007-06-20 于普通用户检索要求的 XML语义搜索技术.为检索出 符合用户查询请求的语义相关的 XML文档片段,文献 [8]定义了两个 XML结点相连关系及多个结点间语义 相关的概念,搜索引擎首先在索引文件中查找与各关键 词匹配的 XML结点,然后判断这些结点之间是否满足 语义相关的条件,如果满足则为检索结果.与传统的基 于关键词的检索相比,XML语义检索提高了检索精度, 但由于要对匹配结点进行语义相关的判断,XML语义 检索的效率至关重要.本文研究了XML文档结构隐藏 的语义,提出了新的索引结构,在此基础上提出了一种 快速的语义搜索算法,并结合实例分析比较了本文算法 的有效性 . 2 相关概念 定义 1 XML文档树 一 个 XML文档可以转换为一棵带标签的树,XML 元素对应于树的结点,每个结点都有一个标签.结点分 维普资讯 http://www.cqvip.com 第 l1 期 李新叶:一种快速的XML语义检索算法 2221 为内部结点和叶子结点;叶子结点是有值没有子结点 的结点,其值为对应元素的 内容 财务内部控制制度的内容财务内部控制制度的内容人员招聘与配置的内容项目成本控制的内容消防安全演练内容 ;内部结点是有子结点 的结点. 观察图1的XML文档树,一个结点代表现实世界 中的一个实体,具有相同标签的两个不同结点对应于 具有相同类型的两个不同实体.而层次相同的结点 5 (标签book)和11(标签为jollma1),以它们为根结点的子 树结构是相同的,我们认为结点 5和 11对应于类型相 似的两个不同实体.如果结点 船是n的祖先结点,则 n 属于 船 所表示的实体.如果结点 n和n’有不同的祖先 结点 n0和n0’,而且 m 和n0’具有相同的标签 ,则 n和 n’在语义上是不相关的,因为它们属于具有相同类型 的两个不同实体.下面的定义给出了这种语义关系,其 中定义3,4,5来自文献[8]. 定义2 语义清晰的XML文档 语义清晰的XML文档指在一棵 XML文档树中,任 何一个结点的标签都不与其祖先结点的标签重名,标 签相同的不同结点代表的实体类型相同,如果它们有 不同的祖先结点,则层次相同的祖先结点为同类型的 或相似类型的. publishers(1) / \\ )\ (11) \ (13) pne~ 图 1 XML文档树 定义3 两个结点相连关系及语义相关概念 令 为一棵XML文档树,n和加为 中的两个结 点.n和加 的最短无向路径由n和加 的最低层(离根 结点最远的)公共祖先分别到 n和加 的路径组成.把 这两条路径组成 的树表示为关系树 加.当 n和 加 满足以下两条件之一时,称 n和加 是相连的: (1) 柚不包含两个具有相同标签的不同结点; (2) 加中唯一具有相同标签的两个不同结点为 n和加 本身. 用 表示这种相连关系.显然, 是 自反的、对称 的二元关系.如果 n和加是 相关的,则它们在语义 上是相关的. 图 1中,结点6和10的关系树 l6.10包括结点6,5, 4,8和结点 10,其中有两个不同结点(5和8)有相同的 标签book,因此结点 6和 10是不相连的.而结点 6和7 是相连的.这直观地反映了书名为 xml的书的价格 ( ce)是 25而不是 30.考虑结点5和8,根据定义3,它 们是相连的,反映了结点5和8代表的两本书是由同一 出版社出版.由定义 3也可以得出结点 6和 13是相连 的,但实际上结点 6和 13属于不同的实体 ,不应满足相 连关系.本文对定义3加以扩展,将定义 3中的相同标 签改为相同标签或相似类型. 定义4 语义相关的一组结点 令 为一棵树, 为 中结点对的相连关系,则 中 的结点对是语义相关的.称一组结点 Ⅳ为全相关的(al1. pai塔R-related),如果对 Ⅳ中的任一结点对(nl,n2),都有 (nl,n2)∈ ;称一组结点 Ⅳ为星型相关的(star R-relat. ed),如果x,:tN有结点nE N,有一个结点 n ∈N使结点对 (n ,n)∈R.称结点 n 为星结点(star center). 如图1中,N={3,6,9}为星型相关的,因为有一个 星结点 3满足(3,6)∈ 和(3,9)∈ .这表明 xml和 e++这两本书都是由名为 high education的出版社出版 的.但 N={3,6,9}不是全相关的,因为(6,9)不相连. 定义 5 语义相关的查询结果 设用户查询表达式形为 Q(s),S=t 一,t 为查 询项序列,其形式为 z:k,z:或:k,其中 z为标签,k为 关键词.如果结点 n的标签为z且其后裔结点的值包含 关键词 k,称结点 n满足查询项 z:k;如果结点 n的标 签为z,称结点 n满足查询项z:;如果结点 n为叶子结 点且其值包含关键词k,称结点 n满足查询项:k. 满足 p中不同查询项的各个结点之间必须是语义 相关的.称结点序列 N=n 一,n 为 Q的星型相关结 果(star R.answer)或全相关结果(al1.pairs R.answer)如果 Ⅳ中的结点为星型相关 (star R.related)或全相关(au. pairs R—related). 如果结点序列 N=n 一,n 为星型相关结果(star R.answer)或全相关结果(al1.pairs R.answer)~lJ称其为 Q 的一个语义相关结果.因为星型相关 比全相关条件宽 松,因此可以检索到更多的结果. 3 新的索引结构 本文提出了一种新的索引结构,主要包括倒排元 素标签索引(ETa),倒排元素值索引(ECI)及结点层次. 路径索引(NⅢ ),如图2、3、4所示.其中,docID是文档 号,用来唯一标识 XML文档;nodeID是某一XML文档 树中的结点标识,是按照深度优先遍历顺序对 XML文 档树遍历得到的序号.(docID,nodelO)可以唯一标识一 个元素结点或属性结点. 为关键词k在某个叶子结 点n中的权值,W(k,n)定义如下: W(k,n)=ooc(k,n)/Il1a】【(OOC( ,n)) (1) 式(1)中 OCC(k,n)为关键词 k在元素结点n的出 现次数. 维普资讯 http://www.cqvip.com 2222 电 子 学 报 20O7正 图2 倒排元素标签索引(ETI) 图3 倒排元素值索引 (ECI) nodeEncode为结点编码,由该结点父结点的编码和 其在兄弟结点中的索引号连接而成,中间用“.”分割. 如图5所示 .Path为结点的路径,如图 5中结点“1.1.1” 的路径为 “animals/animal/name”.为节省存储空间,结 点层次.路径索引表中的path用路径标识 pathlD代替, 再增加一个路径索引 PATH(pathlD,path). / \ nanle birth place 1 : n’ ame.2 (1.1.1) (1..2)nall (1.2.1) (1..2) 图5 结点编码示例 Eli和 ECI用来查询与关键词相匹配的结点,NLPI 提供了结点的层次结构和路径信息,利用这些信息可 以方便快捷地判断两个结点的相连关系.例如,比较图 5的两个结点“1.1.1”和“1.1.2”,找到其相同的前缀字 符串“1.1.”,“1.1.”有两个点符号,然后对“1.1.1”结点 的路径“animals/animal/name”和“1.1.2”结点的路径“an. imals/animal/birthplace”从第2个“/”开始分别截取子串, 得到字符 串”/name”和 “/birthplace”.“/name”和 “/ birthplace”没有类似 “/⋯./”的相 同子串,则说明结点 “1.1.1”和“1.1.2”满足相连关系.不同于文献[8],本文 判断两个结点的相连关系仅仅通过比较两个结点的编 码和路径,此外,本文的索引结构中并没有存储结点对 相连关系的索引表,大大减少了内存的开销. 4 XML语义搜索和快速语义搜索算法 4.1 XML语义搜索的预处理 (1)查询推荐 对于形为:k的查询项,利用查询请求推荐技术进 行扩展,将符合该查询项的叶子结点标签列出,供用户 选择确认.最终查询请求 Q(tl,t2,⋯t )中的查询项都 为标签.关键词或标签的形式. (2)查询结果范围的确定 设(n,,n2,n3,⋯,nk)为一个语义相关的结点集,其 对应的查询结果范围为以这些结点的最低层公共祖先 结点为根结点的子树所代表的XML片段. (3)多个结点星型相关语义的近似 给定一组结点 ,在该结点集中层次最高(离根结点 近)的结点为一个星结点时,称该结点集满足限定的星 型相关.满足限定星型相关的结点集也是语义相关的. 设检索请求Q(tl,t2,⋯, )的检索结果用Ansuer(Q) 表示.用 A (Q)表示满足全相关的检索结果,An. rs(Q)表示满足星型相关的检索结果,4,硎 rRS(Q)表 示满足限定星型相关的检索结果,有: 4n tJe一(Q)c 4n tJe— (Q)c 4n tJe (Q) (2) 对查询项 t,,t ,⋯,t 分别在索引表中查找第一个 匹配结点得到 nl,n2,⋯,n ,如果在结点 nl,n2,⋯,n 中层次最高的结点为 则根据 XML文档子结构的重 复性可以认为与 t 匹配的结点集层次最高,这个结点 集就作为可能的星结点集. 4.2 XML语义搜索的理论基础 设查询请求为 Q(tl,t2,⋯,t ),与 t 查询项匹配 的结点集用N(t )表示,与 查询项匹配的结点集用Ⅳ ( )表示. 命 快递公司问题件快递公司问题件货款处理关于圆的周长面积重点题型关于解方程组的题及答案关于南海问题 1 如果 n1 ,n2 ∈N(t ),而且 n1 ,n2 是 兄弟关系,则在判断结点相连关系时 n1 与 n2 具有 相同的性质,即如果(n1 ,n)∈ ,则有(n2 ,n)∈ , 女Ⅱ(n1 ,n) R,贝0有(n2 ,n) R,其中 n∈N(t ). 证明:(1)女Ⅱ果(n1 ,n)∈R,贝4(n2 ,n)∈R 当 n1 ,n2 是兄弟关系,(n1 ,n)∈ 时,n1 , n2 和 n在文档树中的位置有两种情况,分别如图6和 图 7所示.如果属于图6情况 ,则显然有(n2 ,n)∈ . 对于图7情况,由于 n1 ,n2 是标签相同的兄弟结点, 则组成 . 和 . 的结点集的标签完全相同,因 为(n1 ,n)∈ ,所以有(n2 ,n)∈ . 证明:(2)女Ⅱ(nl ,n)岳R,贝0(n2 ,n) R 当 n1 ,n2 是兄弟关系,(n1 ,n) R时,n1 , n2 和 n在文档树中的位置必然如图7所示.由于 n1 ,n2 是标签相同的兄弟结点,组成 , 和 . 的结点集的标签完全相同,因为(n1 ,n) R, 所以有(n2 ,n) R. · 。 , / ● \ rla 、 ● n 图 6 nl‘,n2‘和 ,l互为兄弟 图 7 ,ll‘,,l2‘和 ,l所处位置的 结点情况 一般情况 命题2 设 N(t )为匹配结点集中层次最高的,即 N(ti)为可能的星结点集.已知结点 n1 ,n2 ∈N(t ), 且 n1 ,n2 不为兄弟关系;结点 n∈N(t ),R为结点 相连关系.如果(nl ,n)∈ ,则 n2 和 n的相连关系 维普资讯 http://www.cqvip.com 第 l1 期 李新叶:一种快速的XML语义检索算法 2223 或者不需要判断或者有(n2 ,n)隹R. 下面分两种情况证明. (1)n1 为 n的祖先 证明:因为 1 ,n2 标签相同,且 n1 为 n的祖 先,则在语义清晰的 XML文档中 n2 与 nl,n均不能 为祖先后代关系,n2 与 nl,/7,在文档树的位置关系如 图8所示.由于 I . 中有两个标签相同的不同结点 n1 和 n2 ,所以(n2 ,n)隹R. ,··,...L砣n O 情况 (1) 情况 (2) .I 删 , ,. nl··,, \Z · _,, ‘ 情况 (3) ● ’日 0 、 图 8 nl*和 为祖先后 图 9 nl*,n2*和 的 3种位置情况 代关系的情况 (2)(n1 ,n)∈R,n1 不为 /7,的祖先 证明:因为(n1 ,n)∈R,n1 不为 /7,的祖先,n1 , n2 不为兄弟关系,n1 ,n2 标签相同,则在语义清晰 的XML文档中 n2 与 n1 ,r/,均不能为祖先后代关系, 那么 n2 与 n1 ,r/,在文档树中的位置关系如图9所 示.对于图9中的(1)和(2)两种情况,由于(n1 ,n)∈ R,n1 ,r/,的最低层公共祖先为nO,.如果( 2 ,n)∈R, n2 与 r/,的最低层公共祖先也为n0,这时不判断 n2 与 n的相连关系不会影响最终结果.因此当判断出 (n1 ,n)∈R时,不需要再判断 2 与 n的相连关系. 对于图9中的情况(3),根据语义清晰的 XML文档的定 义,结点 n1 和 n2 的处于相同层次的祖先结点为同 类型的或相似类型的.在 I . 中必有两个标签相同 或类型相似的不同结点 ,所以(n2 ,n)芒R. 综上所述,如果(n1 ,n)∈R,则 2 和 17,的相连 关系或者不需要判断或者有(n2 ,n)隹R. 4.3 XML快速语义搜索算法 XME语义搜索包括两部分,一是对各查询项搜索 匹配结点,二是对各匹配结点进行语义相关的判断.本 文基于4.2节的概念和理论,结合对深度优先遍历得到 的结点序号按照升序排序的处理,对各匹配结点进行 语义相关的判断过程可以进行如下简化: (1)只需对属于相同文档号的结点进行相连关系 判断; (2)星结点集 N(ti)中两个或多个星结点为兄弟关 系时,只需对其中一个进行与 N(ti)中结点相连关系的 判断; (3)对于星结点 nl ∈N(ti),由结点集 N(ti)的当 前位置结点开始,查找与 1 满足相连关系的结点.如 果找到一个或若干个 n与n1 满足相连关系后下一个 结点 n’与 n1 不相连时就不再继续找.然后 由 N(ti) 中下一个星结点 n2 开始,与 N(tj)中当前位置开始的 结点进行相连关系判断.如图 10,对 Ⅳ(t )中的结点 “1 .3”,在 N(t )中找到结点“1.3.3”与其相连后,指向 N(t )的指针下移指向结点“1.4.3”,经判断结点“1.4. 3”与结点“1.3”不相连,此时指向 N(tj)的指针不再继 续下移.指向 N(ti)的指针移到结点“1.6”处,与 N(t,-) 中当前结点“1.4.3”进行比较.图 10中实线箭头表示所 指向的两结点满足相连关系,虚线箭头表示从箭头指 向的位置开始搜索. 图 1O 语义相关判断过程示意图 下面是本文提出的快速语义搜索算法: 输入:Q(c ck),ETI,ECI,NLPI/与 cl匹配的结点为星结点 输出:answer //语义相关结果 算法: allswer=Selected node from ETI,ECI,NLPI that satisfying cl order by do— clD,nodelD; For eachterm Ciin Q(c2⋯ Ck){ Group Selected nodesfrom ETI,ECI,NLPIthat satisfying c;order by do— clD,nodelD; pes =0;Candao.swer=Null;fred=false; for each element ejin allswer{ nj=(ej) ;//answer中第j个元组的星结点 match=false)and(the end ofGROUP) Setthe current position ofGROUPto pes; match=false; , while(nottothe end ofGROUP){ n=GROUP(pos) //当前位置的结点 if(intercon(nj,n)=true){ e=ejjoin n;Add einto Candanswer; fred=true;match=true; break; { pes + 十 } If(fiIld=true)81"lswer=Candanswer; ELSE 1~[11111 NUJ上: } 1~[11111 answer; 图 l1 快速语义搜索算法 函数 intercon通过比较两个结点的编码和路径完 维普资讯 http://www.cqvip.com 电 子 学 报 2OO7矩 成两个结点相连关系的判断,见第 3节介绍. 由此看出,本文算法在判断多个结点问的语义相 关时避免了大量的结点对相连关系的判断,大大提高 了检索速度.详见实验分析结果. 5 实验分析 本文列出了3种方法下的实验结果进行比较.第一 种方法是用文献[8]的索引及星型相关结果查找算法, 简称文献[8]方法;第二种是用文献[8]的星型相关结果 查找算法,本文的索引及相连函数,简称普通检索算 法;第三种是用本文的索引、相连函数及快速限定星型 相关结果查找算法,简称快速检索算法.实验环境: 800MHZ Pentium Ⅲ计算机,128M内存,Microsoft Win. do~2000 Server操作系统,索引表用 SQL SERVER 2000 关系数据库存储,用 Java语言开发.数据集来自AC1VI SIGMOD主页,其中一个是64KB的Ⅻ 文档(222.xm1), 另—个是大小约为 的SigmodRec~ .ⅪdL9J.表 1列举了8种不同类型的 查询请求.表2列出3种 方法下对222.xnl文档的 检索结果及花费时间,表 3列出 3种方法下对 . modRecord.xnl文档的检 索结果及花费时间. 表1 8种查询请求 Q 查询项组成 Q1 Title:database;fluthol-._ Q2 Tifie'.:author:wei m Q3 tie::author: Q4 Title:datalbase;author:ben kao Q5 :database;:petermuth Q6 Title:;author:weining zhang Q7 Title:database;author:hanan boral Q8 :database;:hanan boral 表2 对2,22.)0旺 文档的检索结果比较 检索时间(秒) Q 结果数 文献[8: 方法 普通检索算法 快速检索算法 Q1 49 740 2.62 2.23 Q2 1 13.71 1.2O 0.83 Q3 239 31O4.7 5.1 2.37 Q4 1 3.25 O.81 0.35 Q5 1 6.31 o.73 0.3l 表3 对 SigrnodReeord.xml文档的检索结果比较 检索时间(秒) Q 结果数 文献[8]方法 普通检索算法 快速检索算法 Q1 734 12o.43 43.04 Q6 1 578.54 1O.90 1.74 Q3 4196 544.93 40.84 Q7 1 99.1O 10.25 9.7 Q8 1 96.97 2.04 0.32 从表2和表3看出,普通检索算法要比文献[8]方 法效率高,说明利用本文的索引结构与相连函数实现 两结点相连关系的判断要比文献[8]的方法有效,尤其 是对于结点总数为90ar7(去除了属性结点后)的XML文 档 SigmodReeord.xml,用文献 [8]方法需要 81117042 (9OO7 —9oo7)个空间存储所有结点对的相连关系,即 使只建立部分相连关系索引,假设部分相连关系索引 占所有结点对相连关系索引的 0.75%,也需要大约 608377个空间.用哈希函数存储该索引时,由于解决地 址冲突带来的时间开销,使文献[8]方法的效率很低. 对于查询Q1和 Q3,用文献[8]方法所需检索时间很长 (以小时计),在表 3中没有列出.在 3种方法中快速检 索算法是最快的一种,尤其是当检索结果数越大时快 速检索算法的优势越明显,因为这时结点相连关系判 断时间是检索时间的主要部分,而快速检索算法省却 了大量的结点对相连关系的判断. 6 结论 本文提出一种新的XML索引结构及基于该索引结 构的两结点相连判断方法 .对 Ⅻ 文档标签及文档结 构所隐藏的语义做了进一步的分析,提出了相关定理 及其证明,基于所提出的理论基础提出了一种快速的 语义检索算法,实验结果表明本文所提出的Ⅻ 索引 结构及快速语义检索算法大大提高了检索效率,这在 XML语义搜索引擎应用中是非常实用的. 参考文献: 【1 J Theobald,G Weikum.The index-based XXL search engine for querying XML data with relevance ranking[A].8thIntemation- al Conference on Extending Database Technology(EDBT) 【CJ.Prague:Springer-Verlag,2OO2.477—495. [2]吴劲,陈泽琳.基于部分匹配的 XML文本文档向量检索 模型[J].电子学报,2OO2,30(12A):2169—2171. Wu Jin,Clan Ze-lin.Vector retrieval modeling using I al match pattern for text-rich XML documents[J].Acta Electroni— ca Sinica,2OO2,3O(12A):2169—2171.(inChinese) [3]曲卫民.中文XML信息检索系统的研究[D].北京:中科 院软件研究所,2004. Qu Wei-min.Research on chinese XML infonnadon rel~eval system[D].BeiJing:Institute of Software,Chinese Academy of Science,2004(in Chinese) [4]王晓燕,王海洋,等.官行调整粒度的XML向量空间检索 [J].武汉大学学报(理学版),2OO4,5O(5):609—613. WangXiao-yan,WangHai-yang,et a1.XMLVector SpaceRe一 val ofautomatic granularity[J].Journal ofWuhanUniversity (Natural Science Edition),2OO4,50(5):609—613.(in Chi. nese) [5]王海波,姜吉发,等 .XML搜索引擎研究[J].计算机应用 研究,2001,18(4):68—71. WangHai-bo,Jiang Ji-fa,et a1.ResearchofXML search engine [J].Application Research Of Computers,2001,18(4):68— 71.(in Chinese) [6]孙伟.基于XML半结构数据索引的研究[D].哈尔滨:哈 维普资讯 http://www.cqvip.com 第 1l 期 李新叶:一种快速的XML语义检索算法 2225 尔滨工程大学,20O4. Sun Wei.Research of Semistructured Data Index Technology Based Oil XML[D].Harbin:Harbin Engineering University, 20O4.(in Chinese) [7]郭永民.XML文档检索技术研究[D].太原 :太原理工大 学 ,2O03. · Guo Yong-min.The Research of XML Documents Retrieval [D].TalYuan:Institutes ofTechnology ofTaiyuan,2O03.(in 作者简介: 李新叶 女,1969年出生于河北平山,华北 电力大学电子与通信工程系,博士.研究方向包 括智能信息处理、信息检索等. E-mail:~jh654@sina.coln Chinese) [8]Sara Cohen,Jonathan Mamou,et a1.XSEarch:a semantic search engine for XML[AJ.Proceedings of the 29th VLDB Conference【C].Berlin:Morgan Kaufinann Publishers,2OO3. 45—56. [9]ACM SIGMOD.Available Products[DB/OL].http://www. acin.org/sigmod/record/xnfl,2(X)6-12-01/2007-3-10. 苑津莎 男,1957年生于天津,华北电力大 学教授,博导.研究方向包括智能信息处理、电 磁场、计算机网络等. 维普资讯 http://www.cqvip.com
本文档为【一种快速的XML语义检索算法】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_811392
暂无简介~
格式:pdf
大小:310KB
软件:PDF阅读器
页数:6
分类:互联网
上传时间:2011-12-31
浏览量:21