-
jsceg分词器源码
jcseg是使用Java开发的一个开源中文分词器,使用流行的mmseg算法实现,并且提供了最高版本的lucene, solr, elasticsearch(New)的分词接口.1。目前最高版本:jcseg-1.9.5。兼容最高版本lucene-4.x,solr-4.x,elasticsearch2。三种切分模式: (1).简易模式:FMM算法,适合速度要求场合。 (2).复杂模式-MMSEG四种过滤算法,具有较高的岐义去除,分词准确率达到了98.41%。 (3).(!New)检测模式:只返回词库中已有的词条,很适合某些应用场合。(1.9.4版本开始)3。支持自定义词库。在lexicon文件夹下,可以随便添加/删除/更改词库和词库内容,并且对词库进行了分类。参考下面了解如何给jcseg添加词库/新词。4。(!New) 支持词库多目录加载. 配置lexicon.path中使用";"隔开多个词库目录.5。(!New)词库分为简体/繁体/简繁体混合词库: 可以专门适用于简体切分, 繁体切分, 简繁体混合切分, 并且可以利用下面提到的同义词实现,简繁体的相互检索, jcseg同时提供了词库两个简单的词库管理工具来进行简繁体的转换和词库的合并.6。中英文同义词追加/同义词匹配 + 中文词条拼音追加.词库整合了《现代汉语词典》和cc-cedict辞典中的词条,并且依据cc-cedict词典为词条标上了拼音,依据《中华同义词词典》为词条标上了同义词(尚未完成)。更改jcseg.properties配置文档可以在分词的时候加入拼音和同义词到分词结果中。7。中文数字和中文分数识别,例如:"一百五十个人都来了,四十分之一的人。"中的"一百五十"和"四十分之一"。并且jcseg
- 2022-03-07 04:18:17下载
- 积分:1
-
fast Ica matlab算法,经过试验验证了,希望对大家有用处
fast Ica matlab算法,经过试验验证了,希望对大家有用处-fast algorithm, the test after test, we hope to be useful
- 2023-07-30 05:00:03下载
- 积分:1
-
差分演化 通用版 修改下就可以用,有很多例子
资源描述差分演化 通用版 修改下就可以用,有很多例子
- 2022-04-08 23:39:53下载
- 积分:1
-
变密度优化算法
此为变密度优化算法的程序,好用简单容易理解,本人已经在matlab软件上运行过,与渐进结构优化算法有很多相似的地方,可以借鉴草考进行深入研究。如果大家有渐进结构优化算法的研究的人,大家可以共同进步
- 2022-01-26 20:24:57下载
- 积分:1
-
GUASS算法的列主元消去法
GUASS算法的列主元消去法-GUASS algorithm out PCA Elimination
- 2022-05-10 12:39:54下载
- 积分:1
-
此为基于图像配准的傅立叶变换源代码,已精心调试过,请放心使用....
此为基于图像配准的傅立叶变换源代码,已精心调试过,请放心使用.-This is the image registration based on the Fourier Transform source code, has been painstakingly debugging, please rest assured that use.
- 2022-03-14 16:33:33下载
- 积分:1
-
基于连续蚁群算法融合的神经网络RFID 信号分布模型
资源描述基于人工神经网络方法建立了RFID 反射信号强度分布模型. 该方法仅依赖数据,实施简
单. 为克服传统BP 算法对初值敏感、易陷入局部极值的缺陷,引入一种连续的蚁群优化算法来
确定多层神经网络的权值,该算法具有更强的全局搜索能力和效率. 讨论了算法的基本理论和具
体步骤,最后利用实际RFID 设备采集的反射信号强度数据对算法进行测试,对理论信号模型和
实际的建模结果进行了比较,并分析了算法的逼近能力和泛化能力. 结果表明在考虑到不可避免
的误差和扰动下,所提出的方法可以更好地建模RFID 信号强度的实际分布,具有良好的性能.
- 2022-08-15 11:57:59下载
- 积分:1
-
中文分词1.0
简介 ChineseSplitter中文分词系统集成了单字(一元切分)、双字(二元切分)、词义切分等分词方法。提供很好的权重计算办法。类结构 BaseSplitter(分词基类)─SingleSplitter(一元切分)─DoubleSplitter(二元切分)─DefaultSplitter(词义切分)────NICTCLAS(中科院分词系统)KeywordsSort(关键字排序类)
- 2022-01-30 17:14:00下载
- 积分:1
-
顶盖驱动LBM模拟
应用背景顶盖驱动流是计算流体与计算传热学一个经典问题,常用作不可压缩流动的校核算例,同时也是很好的lbm模拟学习的入门算例。对于刚开始接触的入门者有很大帮助。关键技术该程序采用了不可压缩的D2Q9模型以及标准的碰撞迁移规则,边界处理则采用了非平衡外推格式。虽然程序针对顶盖驱动而编写,但读者可以通过改变初始条件边界条件来计算其他的物理量。
- 2023-03-21 19:05:03下载
- 积分:1
-
这是个NPC问题求解,PassBridge code
这是个NPC问题求解,PassBridge code-NPC This is a problem solving, PassBridge code
- 2022-03-18 03:53:50下载
- 积分:1