下载

2下载券

加入VIP
  • 专属下载特权
  • 现金文档折扣购买
  • VIP免费专区
  • 千万文档免费下载

上传资料

关闭

关闭

关闭

封号提示

内容

首页 HanLP

HanLP.doc

HanLP

本人夏尕妖
2019-05-30 0人阅读 举报 0 0 暂无简介

简介:本文档为《HanLPdoc》,可适用于综合领域

HanLPHanLP下载文档联系关于调用简单欢迎使用HanLPHanLPvHanLP是由一系列模型与算法组成的Java工具包,目标是普及自然语言处理在生产环境中的应用。不仅仅是分词,而是提供词法分析、句法分析、语义理解等完备的功能。HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。DownloadFreeOpenSourceHanLP完全开源,包括词典。不依赖其他jar,底层采用了一系列高速的数据结构,如双数组Trie树、DAWG、AhoCorasickDoubleArrayTrie等,这些基础件都是开源的。官方模型训练自人民日报语料库,您也可以使用内置的工具训练自己的模型。StarMeEasytoUse通过工具类HanLP您可以一句话调用所有功能,文档详细,开箱即用。底层算法经过精心优化,极速分词模式下可达,万字秒,内存仅需MB。在IO方面,词典加载速度极快,只需ms即可快速启动。HanLP经过多次重构,欢迎二次开发。Documentation组件一览技术参数HanLPv的特征:最高分词速度,万字秒(极速分词,GHzi)万词典,覆盖现代汉语常用词、网络新词等万接续BiGram文法模型ms词典加载训练自年人民日报切分语料词语标注集兼容《ICTPOS汉语词性标记集》词语标注集兼容《现代汉语语料库加工规范词语切分与词性标注》最低内存要求MB(XmsmXmxmXmnm)基于双数组Trie的AhoCorasick自动机算法实现O(n)多模式匹配运行于Java提供Lucene插件,兼容LucenexApacheLicenseVersionHanLP产品初始知识产权归上海林原信息科技有限公司所有,任何人和企业可以无偿使用,可以对产品、源代码进行任何形式的修改,可以打包在其他产品中进行销售。任何使用了HanLP的全部或部分功能、词典、模型的项目、产品或文章等形式的成果必须显式注明HanLP及此项目主页。最新版本:HanLPv下载Copyright上海林原信息科技有限公司HanLP下载文档联系关于调用简单欢迎使用HanLPHanLPvHanLP是由一系列模型与算法组成的Java工具包,目标是普及自然语言处理在生产环境中的应用。不仅仅是分词,而是提供词法分析、句法分析、语义理解等完备的功能。HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。DownloadFreeOpenSourceHanLP完全开源,包括词典。不依赖其他jar,底层采用了一系列高速的数据结构,如双数组Trie树、DAWG、AhoCorasickDoubleArrayTrie等,这些基础件都是开源的。官方模型训练自人民日报语料库,您也可以使用内置的工具训练自己的模型。StarMeEasytoUse通过工具类HanLP您可以一句话调用所有功能,文档详细,开箱即用。底层算法经过精心优化,极速分词模式下可达,万字秒,内存仅需MB。在IO方面,词典加载速度极快,只需ms即可快速启动。HanLP经过多次重构,欢迎二次开发。Documentation组件一览技术参数HanLPv的特征:最高分词速度,万字秒(极速分词,GHzi)万词典,覆盖现代汉语常用词、网络新词等万接续BiGram文法模型ms词典加载训练自年人民日报切分语料词语标注集兼容《ICTPOS汉语词性标记集》词语标注集兼容《现代汉语语料库加工规范词语切分与词性标注》最低内存要求MB(XmsmXmxmXmnm)基于双数组Trie的AhoCorasick自动机算法实现O(n)多模式匹配运行于Java提供Lucene插件,兼容LucenexApacheLicenseVersionHanLP产品初始知识产权归上海林原信息科技有限公司所有,任何人和企业可以无偿使用,可以对产品、源代码进行任何形式的修改,可以打包在其他产品中进行销售。任何使用了HanLP的全部或部分功能、词典、模型的项目、产品或文章等形式的成果必须显式注明HanLP及此项目主页。最新版本:HanLPv下载Copyright上海林原信息科技有限公司HanLP下载文档联系关于调用简单欢迎使用HanLPHanLPvHanLP是由一系列模型与算法组成的Java工具包,目标是普及自然语言处理在生产环境中的应用。不仅仅是分词,而是提供词法分析、句法分析、语义理解等完备的功能。HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。DownloadFreeOpenSourceHanLP完全开源,包括词典。不依赖其他jar,底层采用了一系列高速的数据结构,如双数组Trie树、DAWG、AhoCorasickDoubleArrayTrie等,这些基础件都是开源的。官方模型训练自人民日报语料库,您也可以使用内置的工具训练自己的模型。StarMeEasytoUse通过工具类HanLP您可以一句话调用所有功能,文档详细,开箱即用。底层算法经过精心优化,极速分词模式下可达,万字秒,内存仅需MB。在IO方面,词典加载速度极快,只需ms即可快速启动。HanLP经过多次重构,欢迎二次开发。Documentation组件一览技术参数HanLPv的特征:最高分词速度,万字秒(极速分词,GHzi)万词典,覆盖现代汉语常用词、网络新词等万接续BiGram文法模型ms词典加载训练自年人民日报切分语料词语标注集兼容《ICTPOS汉语词性标记集》词语标注集兼容《现代汉语语料库加工规范词语切分与词性标注》最低内存要求MB(XmsmXmxmXmnm)基于双数组Trie的AhoCorasick自动机算法实现O(n)多模式匹配运行于Java提供Lucene插件,兼容LucenexApacheLicenseVersionHanLP产品初始知识产权归上海林原信息科技有限公司所有,任何人和企业可以无偿使用,可以对产品、源代码进行任何形式的修改,可以打包在其他产品中进行销售。任何使用了HanLP的全部或部分功能、词典、模型的项目、产品或文章等形式的成果必须显式注明HanLP及此项目主页。最新版本:HanLPv下载Copyright上海林原信息科技有限公司

用户评价(0)

关闭

新课改视野下建构高中语文教学实验成果报告(32KB)

抱歉,积分不足下载失败,请稍后再试!

提示

试读已结束,如需要继续阅读或者下载,敬请购买!

文档小程序码

使用微信“扫一扫”扫码寻找文档

1

打开微信

2

扫描小程序码

3

发布寻找信息

4

等待寻找结果

我知道了
评分:

/6

HanLP

VIP

在线
客服

免费
邮箱

爱问共享资料服务号

扫描关注领取更多福利