首页 23_Solr技术文档

23_Solr技术文档

举报
开通vip

23_Solr技术文档SOLR技术文档1.了解lucn原理,全文搜索概念,参考(http:wishlif.jaay.comcatgory30179).建立自己的索引库.2.了解solr参考(http:www.ibm.comdloprworkscnjaajsolr1,http:www.ibm.comdloprworkscnjaajsolr2).并下载实例程序.3.搭建SOLR服务器3.1官方下载apachsolr1.3.0.zip和tomcat5.53.2将apachsolr1.3.0\xampl\wbapps\solr.war部署有to...

23_Solr技术文档
SOLR技术文档1.了解lucn原理,全文搜索概念,参考(http:wishlif.jaay.comcatgory30179).建立自己的索引库.2.了解solr参考(http:www.ibm.comdloprworkscnjaajsolr1,http:www.ibm.comdloprworkscnjaajsolr2).并下载实例程序.3.搭建SOLR服务器3.1官方下载apachsolr1.3.0.zip和tomcat5.53.2将apachsolr1.3.0\xampl\wbapps\solr.war部署有tomcat下3.3设置solr环境变量apachtomcat5.5.26\conf\Catalina\localhost\下新建solr.xml文件 内容 财务内部控制制度的内容财务内部控制制度的内容人员招聘与配置的内容项目成本控制的内容消防安全演练内容 如下:<?xmlrsion=1.0ncoding=UTF8?><ContxtdocBas=dbug=0crossContxt=tru><Enironmntnam=solrhomtyp=jaa.lang.Stringalu=:tomcatsolrorrid=tru><Contxt>设置:tomcatsolr为solr主目录,建立文件夹.3.4将apachsolr1.3.0\xampl\solr下所有文件复制到:tomcatsolr下3.5启动tomcat>浏览http:localhost:8080solradmin能访问SolrAdmin页面说明Solr服务器设置成功.4.为Solr创建索引库4.1在:tomcatsolr目录下新建名为data的文件夹,再在data下新建indx名为文件夹4.2将lucn创建好的索引放入:tomcatsolrdataindx下5.Solr索引设置5.1在:tomcatsolrconf下solrconfig.xml,schma.xml<2>中的技术文档有详细说明5.2中文支持,如果你的索引要支持中文搜索的话,在此推荐庖丁分词,参考(http:www.jaay.comtopic110148)schma.xml设置如下:中文词组分词<fildtypnam=txtclass=solr.TxtFildpositionIncrmntGap=100>创建索引时<analyzrtyp=indx><toknizrclass=com.chuangs.fulltxtsarch.analyzr.ChinsToknizrFactorymod=mostwords><analyzr>搜索时<analyzrtyp=qury><toknizrclass=com.chuangs.fulltxtsarch.analyzr.ChinsToknizrFactorymod=mostwords><analyzr><fildtyp>中文单词分词<fildtypnam=wordclass=solr.TxtFildpositionIncrmntGap=100>panxiuyan仅供参考<analyzrtyp=indx><toknizrclass=org.apach.solr.analysis.StandardToknizrFactory><analyzr><fildtyp>相关搜索fild设置词组<fildnam=XXXXtyp=txtindxd=trustord=trumultiValud=truomitNorms=tru>单词<fildnam=XXXXWordtyp=wordindxd=trustord=trumultiValud=truomitNorms=tru>注:com.fulltxtsarch.analyzr.ChinsToknizrFactory是用solr封装的庖丁分词,如下:importjaa.io.Radr;importjaa.util.Map;importnt.paoding.analysis.analyzr.PaodingToknizr;importnt.paoding.analysis.analyzr.ToknCollctor;importnt.paoding.analysis.analyzr.impl.MaxWordLngthToknCollctor;importnt.paoding.analysis.analyzr.impl.MostWordsToknCollctor;importnt.paoding.analysis.knif.PaodingMakr;importorg.apach.lucn.analysis.ToknStram;importorg.apach.solr.analysis.BasToknizrFactory;publicclassChinsToknizrFactoryxtndsBasToknizrFactory{最多切分默认模式publicstaticfinalStringMOSTWORDSMODE=mostwords;按最大切分publicstaticfinalStringMAXWORDLENGTHMODE=maxwordlngth;priatStringmod=null;publicoidstMod(Stringmod){if(mod==null||MOSTWORDSMODE.qualsIgnorCas(mod)||dfault.qualsIgnorCas(mod)){this.mod=MOSTWORDSMODE;}lsif(MAXWORDLENGTHMODE.qualsIgnorCas(mod)){this.mod=MAXWORDLENGTHMODE;}ls{thrownwIllgalArgumntExcption(不合法的 分析 定性数据统计分析pdf销售业绩分析模板建筑结构震害分析销售进度分析表京东商城竞争战略分析 器Mod参数设置:+mod);}}@Orridpublicoidinit(Mapargs){supr.init(args);stMod(args.gt(mod).toString());}publicToknStramcrat(Radrinput){rturnnwPaodingToknizr(input,PaodingMakr.mak(),cratToknCollctor());}priatToknCollctorcratToknCollctor(){if(MOSTWORDSMODE.quals(mod))rturnnwMostWordsToknCollctor();if(MAXWORDLENGTHMODE.quals(mod))rturnnwMaxWordLngthToknCollctor();thrownwError(nrhappnd);}}6.Solr搜索6.1相关url介绍http:localhost:8080solrslct查询索引路径http:localhost:8080solrupdat查询更新路径6.2查询参数介绍fl=,scorq.op=ANDstart=0rows=16hl=truhl.fl=mrHadinghl.snippts=3hl.simpl.pr=<fontcolor=rd>hl.simpl.post=<font>fact=trufact.fild=mrCatgoryq=+(mrHading%3A%E4%BD%A0%E5%A5%BD+AND+mrHadingWithWord%3A%E6%BD%98)+mrActualndTim:[1239264030468TO1240473630468]sort=mrActualndTimascfl表示索引显示那些fild(表示所有fild,scor是solr的一个匹配热度)q.op表示q中查询语句的各条件的逻辑操作AND(与)OR(或)start开始返条数rows返多少条hl是否高亮hl.fl高亮fildhl.snippts不太清楚(反正是设置高亮3就可以了)hl.simpl.pr高亮前面的格式hl.simpl.post高亮后面的格式fact是否启动统计fact.fild统计fildq查询语句(类似SQL)相关详细的操作还需lucn的qury语法sort排序6.3中文搜索中文搜索时必须要将中文URLEncodr.ncod用UTF8,tomcat还需设置URIEncoding=UTF8,用GET方式发送请求.如:mrHading%3A%E4%BD%A0%E5%A5%BD+AND+mrHadingWithWord%3A%E6%BD%98我是要搜索“你好潘”因为庖丁分词没有单词分词,当搜索中有单词是还需要使用另外的fild,所以在程序中要分解“你好潘”成”你好””潘”,然后”你好”用mrHading搜索,”潘”用mrHadingWithWord搜索再取他们的并集(AND操作)7.Solr相关命令7.1新建和更新<add><doc><fildnam=id>1<fild><fildnam=mrHading>你好潘修艳<fild><fildnam=mrHadingWithWord>你好潘修艳<fild><doc><doc><fildnam=id>2<fild><fildnam=mrHading>你好潘修艳1<fild><fildnam=mrHadingWithWord>你好潘修艳1<fild><doc><add>新建和更新的文档格式一样,注fild有””字符用”amp;”替换.发送到http:localhost:8080solrupdat用POST方式7.2删除<dlt><id>1<id><id>2<id>发送到http:localhost:8080solrupdat用POST方式7.3提交以上操作如果需要生效的需要提交命令<commit>发送到http:localhost:8080solrupdat用POST方式7.4优化索引库<optimiz>发送到http:localhost:8080solrupdat用POST方式8.总结以上是个人项目开发时的技术总结,如有错误请指出,与大家一齐分享成果是一件很开心的事.作者:潘修艳20090409
本文档为【23_Solr技术文档】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_751522
暂无简介~
格式:pdf
大小:91KB
软件:PDF阅读器
页数:5
分类:互联网
上传时间:2016-12-24
浏览量:17