关闭

关闭

关闭

封号提示

内容

首页 信息检索-计算机检索基础知识

信息检索-计算机检索基础知识.ppt

信息检索-计算机检索基础知识

叨叨 2010-06-20 评分 0 浏览量 0 0 0 0 暂无简介 简介 举报

简介:本文档为《信息检索-计算机检索基础知识ppt》,可适用于其他资料领域,主题内容包含第三讲计算机检索基本知识第三讲计算机检索基本知识计算机检索计算机检索Internet检索数据库检索计算机检索相关概念数据库相关概念检索点检索表达式检符等。

第三讲计算机检索基本知识第三讲计算机检索基本知识计算机检索计算机检索Internet检索数据库检索计算机检索相关概念数据库相关概念检索点检索表达式检索途径的组配光盘检索系统CDROMSEARCHING()Internet检索InternetSearching()脱机检索阶段OfflineRetrieval()联机检索阶段OnlineRetrieval()国际联机检索()数据库的相关概念:数据库是在计算机存储设备上按一定方式存储的相互关联的数据集合。它将各种数据中的信息单元经过有序处理、组织,可以按通常的方法进行维护和检索并且具有共享性。※通俗地说数据库就是由多张表构成的数据库的相关概念:数据库本质的三个要素相关数据共同存取方式和一定组织方式共享数据库的类型参考数据库源数据库按信息内容分书目数据库指南数据库全文数据库数值数据库光盘数据库网络数据库数据库的类型按载体形式分单机版网络版联机数据库镜像站数据库数据库的结构数据库是由一个或多个文档(File)构成的集合,每个文档由若干记录(Record)组成,每条记录由若干字段(Field)构成。文档(File)文档是数据库中一部分记录的集合。许多大型数据库往往包含有数个以万计的记录为便利用户检索常划分为若干文档。另一方面从数据库内部结构来看文档是指数据库内容的组成的基本形式是由若干个逻辑记录构成的信息集合。记录(Record)记录是构成数据库的信息单元每条记录都描述了一个原始信息的外表和内容特征。文献型数据库中的一条记录通常是一篇文献的描述包括题录、文摘、主题词等。字段(Field)一条记录通常由一些数据项组成这些组成记录的数据项就是字段。例如一篇期刊论文的书目记录主要包括篇名、作者、作者单位、来源、文摘、主题词等字段。每一个字段通常由两个字母所组成的代码表示如TI(Title)AU(Author)等。字段(Field)对计算机检索来说字段相当于检索入口。基本索引字段:描术文献内容特征的字段如篇名(TI)、文摘(AB)辅助索引字段:描述文献外部特征的字段如著者(AU=)、著者单位(AA=)、语种(LA=)、出版年(PY=)等字段(field)记录(record)文档(file):一张表就是一个文档文档文档n数据库(database)数据库结构图检索点accesspoint即检索途径approach。分类确定分类号主题主题词或关键词题名书名、刊名、篇名(允许中英文混合或是题名的一部分)号码ISBN、ISSN、专利号、标准号作者个人,团体单位名称基金基金名称(受该基金支持所获得成果的文献)检索表达式=检索词检索表达式是检索策略的具体体现(documentWretrievalordocumentWdeliveryordocumentWdeliveryWsystem*)and(digitalWlibrar*orelectronicWlibrar*orvirtualWlibrar*)各种符号布尔逻辑符位置算符截词符字段限制符布尔逻辑算符布尔逻辑算符逻辑“与”(AND或*)运算符※使用于需要组配不同概念的检索词之间※检索词(概念交叉和限定关系)※作用:缩小检索范围提高查准率。WTOANDChinaWTOChina例:计算机在图书馆中的应用提问式:计算机and图书馆或计算机*图书馆逻辑“与”(AND或*)运算符※使用于需要组配不同概念的检索词之间※检索词(概念交叉和限定关系)※作用:缩小检索范围提高查准率。逻辑“或”(OR或)运算符※使用于相同或近似概念的同义词、同族词之间※检索词(并列关系)※作用:扩大检索范围提高查全率。enterprisecompanycompanyORenterprise如:微机or电脑orPC机或微机电脑PC机逻辑非(NOT或)运算符※使用于需要从某个概念中剔除另一个概念的场合※检索词(排除关系)※作用:排除不需要和影响检索结果的概念提高查准率。patentGermanPATENTNOTGERMAN例:“计算机NOT微机”或“计算机微机”使用优先处理算符“()”※“NOT”算符有排除掉相关文献的可能因此在实际检索中应慎重使用。优先级运算()>NOT>AND>OR※英文数据库通常用字母中文数据库要用符号布尔逻辑提问式确定了表达概念的检索词间的逻辑关系但它不能确定检索词与检索词相互之间的位置关系。使用位置算符邻接检索(ProximitySearching):表明两或多个检索词之间关系的符号常用的位置算符有:(W)(nW)(N)(nN)W表示两个词不可以互换顺序表达式:Education(W)school或EducationWITHschool检索结果:Educationschooleducationschools表达式:Education(W)school检索结果:EducationschooleducationschoolsEducationandmusicschoolN表示两个词可以互换顺序表达式:Education(N)school检索结果:EducationschoolschoolofeducationEducationandschoolschoolofmusicandeducation表达式:Education(N)schoolEducationNEARschool检索结果:EducationschoolEducationschoolsS功能:同句检索其词序与词量不受限制表达式:Education(S)school检索结果:Education和school两词出现在同一句子中即可。F功能:同字段检索词序与词量不限表达式:Education(F)schoolDE检索结果:Education和school必须同时出现在叙词字段内即可nearFindsrecordsthatcontainbothoftwotermsinthesamesentencewithFindsrecordsthatcontainbothoftwotermsinthesamefield注意:near和with是两个比较特殊的位置算符与and、or、not比较后三者的检索结果是限制在同一条记录中范围较near和with更大。不同的数据库所提供的位置算符不完全相同在实际检索时应注意阅读使用帮助文件。有限截词:即在检索词后后截几个有限的字母如名词的单复数动词的词尾变化等。如输入computer表示有个字母变化可检出computer和computers输入stud表示截断处有个字母变化可检出study,studies,studied,studing截词符(Truncation):有问号?、星号*等。截词符(Truncation):有问号?、星号*等。无限截断:在检索词后加一个“*”表示该词后可加任意个字符。使用无限截词所截词根不能太短否则会输出许多无关文献造成误检。如:computer*可检出computers,computering,computered,computerization截词方式前截断:*magneticmagnetic,electromagnetic,electromagnetic,thermomagnetic,…后截断:librar*library,libraries,librarian,…中截断:organiationorganization,organisation指定检索提问在特定字段中出现只有在指定的字段中出现与检索提问相同的记录才被检索出来。如要求检索的内容在题目中出现。通常的字段限制范围的大小顺序是:题名<关键词<摘要<全文常用的检索符号有:in、=、<、>、、字段限制检索riceinti(只在题目字段中查找)riceinde(只在主题词中查找)riceinab(只在文摘中查找)au=SmithJC(作者为SmithJC)py=(只查年的文章)la=Chinese(只查语种为中文的文献)字段限制检索基本字段辅助字段TI:篇名字段(Title)。AU:作者字段(Author)。CS:作者所在单位字段(CorporateSource)。SO:文献来源字段(SourcePublication)。包括期刊名称、年卷、期、页等或包括会议事项。PY:出版年份(PublicationYear)。LA:语种字段(Language)表示原文的语种。DT::文献类型字段(DocumentType)。AB:文摘字段(Abstract)。※对于不同检索系统、不同数据库来说其记录格式、字段代码、字段数目可能不完全相同。词组的检索:通常用“”或()来表示两词是作为一个词组来检索的如:“hypermediadatabase”“profitandloss”将查找profitandloss※各数据库的相关规定有所差异,在使用的时候要做相应的调整!补充说明检索途径组配检索途径组配高级检索:缩小或扩大检索范围二次检索(新的检索词属限制检索)※在简单检索或高级检索基础上※缩小检索范围※多次使用所有文章经过一次检索后在上一次检索结果的范围内进行再次检索清华大学孙家广扩大检索范围提高查全率的方法:、考虑同义词或近义词(使用布尔逻辑符or连接)、选择较大检索范围的字段如摘要、使用截词符、使用上位词(如飞行器航天飞机载人航天飞机)缩小检索范围提高查准率的方法:、使用and、not等限制检索范围、使用位置算符、选择检索范围较小的字段、使用二次检索、使用下位词、使用精确检索如对于固定短语来说可用“”引起来“任意一致”“完全一致”“前方一致”精确匹配和模糊检索※分类号作者第一作者刊名关键词

用户评论(0)

0/200

精彩专题

上传我的资料

每篇奖励 +1积分

资料评分:

/55
0下载券 下载 加入VIP, 送下载券

意见
反馈

立即扫码关注

爱问共享资料微信公众号

返回
顶部

举报
资料