登录
首页 » 算法 » jsceg分词器源码

jsceg分词器源码

于 2022-03-07 发布 文件大小:17.41 MB
0 70
下载积分: 2 下载次数: 1

代码说明:

jcseg是使用Java开发的一个开源中文分词器,使用流行的mmseg算法实现,并且提供了最高版本的lucene, solr, elasticsearch(New)的分词接口.1。目前最高版本:jcseg-1.9.5。兼容最高版本lucene-4.x,solr-4.x,elasticsearch2。三种切分模式: (1).简易模式:FMM算法,适合速度要求场合。 (2).复杂模式-MMSEG四种过滤算法,具有较高的岐义去除,分词准确率达到了98.41%。 (3).(!New)检测模式:只返回词库中已有的词条,很适合某些应用场合。(1.9.4版本开始)3。支持自定义词库。在lexicon文件夹下,可以随便添加/删除/更改词库和词库内容,并且对词库进行了分类。参考下面了解如何给jcseg添加词库/新词。4。(!New) 支持词库多目录加载. 配置lexicon.path中使用";"隔开多个词库目录.5。(!New)词库分为简体/繁体/简繁体混合词库: 可以专门适用于简体切分, 繁体切分, 简繁体混合切分, 并且可以利用下面提到的同义词实现,简繁体的相互检索,  jcseg同时提供了词库两个简单的词库管理工具来进行简繁体的转换和词库的合并.6。中英文同义词追加/同义词匹配 + 中文词条拼音追加.词库整合了《现代汉语词典》和cc-cedict辞典中的词条,并且依据cc-cedict词典为词条标上了拼音,依据《中华同义词词典》为词条标上了同义词(尚未完成)。更改jcseg.properties配置文档可以在分词的时候加入拼音和同义词到分词结果中。7。中文数字和中文分数识别,例如:"一百五十个人都来了,四十分之一的人。"中的"一百五十"和"四十分之一"。并且jcseg

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论

0 个回复

  • Each case the geometric algorithm is set, the geometric algorithm of data is cer...
    各种情况的几何算法集,对数据的几何算法计算有一定的帮助作用-Each case the geometric algorithm is set, the geometric algorithm of data is certainly helpful to the role of
    2022-01-28 07:52:50下载
    积分:1
  • 插值
    这个是谐波处理的插值算法 具体的内容程序里面有描述,主要思想就是插值,修正,然后恢复,使得没有因为同步处理的信号更好展示
    2022-08-07 06:32:39下载
    积分:1
  • C Source Code program of FFT IFFT Function
    C Source Code program of FFT IFFT Function
    2022-03-17 18:46:55下载
    积分:1
  • 隐式消元程序 比较精炼
    隐式消元法计算程序 比较精炼 -implicit elimination method calculation procedures more refined
    2022-02-22 08:20:03下载
    积分:1
  • Na Na nounou
    #! JMP 04@JSR 20 83 89 12#! LOP#! END#! JMP 04@JSR 20 83 89 12#! LOP#! END#! JMP 04@JSR 20 83 89 12#! LOP#! END#! JMP 04@JSR 20 83 89 12#! LOP#! END#! JMP 04@JSR 20 83 89 12#! LOP#! END
    2023-01-22 12:35:04下载
    积分:1
  • 数据结构
    快速排序是一种分而治之的排序算法
    2023-08-27 18:00:06下载
    积分:1
  • 基于布沙尔模型的七参数坐标转换程序
    本程序基于MFC解算坐标转换的三个参数(旋转参数,平移参数,缩放参数),对研究三维坐标转换可以看一下。
    2022-02-10 08:23:07下载
    积分:1
  • 回溯解决0-1背包问题
    问题给定n中物品和一个背包,物品i的重量为wi,价值为vi,背包的总容量为W。要选择装入背包的物品使得装入背包物品的总价值最大。对于每一个物品只有选中放入背包和不选中两种状态,分别用1和0来表示。可将0-1背包问题解空间组织成子集树的形式。以深度优先的方式,由父节点开始搜索整个解空间,将选中的物品价值和重量加到总价值和总重量里面。当遍历所有分支和节点,比较得到问题的最有解和最优值。
    2022-04-21 15:07:42下载
    积分:1
  • a 3x3 matrix multiplication
    a 3x3 matrix multiplication
    2023-04-17 07:05:03下载
    积分:1
  • GAFORTRAN库
    资源描述                       GA算法的fortran通用 库,   加入少量代码就能用           GA算法的fortran通用 库,   加入少量代码就能用
    2022-04-06 15:49:30下载
    积分:1
  • 696518资源总数
  • 104269会员总数
  • 31今日下载