-
jsceg分词器源码
jcseg是使用Java开发的一个开源中文分词器,使用流行的mmseg算法实现,并且提供了最高版本的lucene, solr, elasticsearch(New)的分词接口.1。目前最高版本:jcseg-1.9.5。兼容最高版本lucene-4.x,solr-4.x,elasticsearch2。三种切分模式: (1).简易模式:FMM算法,适合速度要求场合。 (2).复杂模式-MMSEG四种过滤算法,具有较高的岐义去除,分词准确率达到了98.41%。 (3).(!New)检测模式:只返回词库中已有的词条,很适合某些应用场合。(1.9.4版本开始)3。支持自定义词库。在lexicon文件夹下,可以随便添加/删除/更改词库和词库内容,并且对词库进行了分类。参考下面了解如何给jcseg添加词库/新词。4。(!New) 支持词库多目录加载. 配置lexicon.path中使用";"隔开多个词库目录.5。(!New)词库分为简体/繁体/简繁体混合词库: 可以专门适用于简体切分, 繁体切分, 简繁体混合切分, 并且可以利用下面提到的同义词实现,简繁体的相互检索, jcseg同时提供了词库两个简单的词库管理工具来进行简繁体的转换和词库的合并.6。中英文同义词追加/同义词匹配 + 中文词条拼音追加.词库整合了《现代汉语词典》和cc-cedict辞典中的词条,并且依据cc-cedict词典为词条标上了拼音,依据《中华同义词词典》为词条标上了同义词(尚未完成)。更改jcseg.properties配置文档可以在分词的时候加入拼音和同义词到分词结果中。7。中文数字和中文分数识别,例如:"一百五十个人都来了,四十分之一的人。"中的"一百五十"和"四十分之一"。并且jcseg
- 2022-03-07 04:18:17下载
- 积分:1
-
基于信号强度的垂直切换
本代码是主基础基于信号强度的垂直切换算法的一个仿真代码。其中考虑到影响信号强度的有大尺度衰落和小尺度衰落。本代码给出了一个简单的模型。代码如下:
- 2022-11-03 14:15:03下载
- 积分:1
-
打开包装在 Matlab 中的 2d
Matlab 包含 1 D 相位展开算法。
如果 2D 是必需的像在图像杨春宝,这件事是复杂得多和风险并不是 univoque。
该项目允许使 2D 松绑。
- 2022-03-20 16:58:22下载
- 积分:1
-
来客登记系统 c语言
资源描述
工程设计作业
- 2022-01-28 23:48:12下载
- 积分:1
-
using gall function for measure the algorithm
using gall function for measure the algorithm
- 2022-02-02 05:22:06下载
- 积分:1
-
复合形法的不等式约束优化。其中的主程序是通用的,只要修改自己的目标函数和约束条件即可。...
复合形法的不等式约束优化。其中的主程序是通用的,只要修改自己的目标函数和约束条件即可。-Complex method of inequality constrained optimization. One of the main program is commonly used, as long as the amendments to its own objective function and constraint conditions.
- 2022-03-25 07:27:58下载
- 积分:1
-
一个正二十面体的细分迭代工程,很漂亮,需要glut
一个正二十面体的细分迭代工程,很漂亮,需要glut-an icosahedron is the breakdown of iterative engineering, and very pretty, needs glut
- 2022-07-12 14:02:38下载
- 积分:1
-
K-均值算法
Hadoop 基地 K-均值算法
2013 年 11 月 29 日。现在我们释放 ankus 0.1 !
Ankus 0.1 的新功能
1) 分类-ID3
2) 聚类-EM
3) 相似性-基于内容的相似性
建议基于项目 4) 建议系统-
5) 建议验证模块 (使用 RMSE)
- 2022-01-25 17:58:36下载
- 积分:1
-
K-means 的C++实现
程序包含一个C++代码和一个经典的matlab算法,主要用来实现k-means 和 GMM算法,大家可以参考一下,附带有两个dataset,谢谢!K-means 和 GMM都是机器学习中很重要的两个算法实现,希望对学习相关知识有所帮助。
- 2023-04-03 10:10:04下载
- 积分:1
-
时钟接口
应用背景根据地铁时钟系统的内定协议进行数据解析、处理。PIS系统与时钟系统接口软件能够接收时钟系统发送的时钟信息,并且根据该信息校正控制中心服务器的系统时钟。关键技术串口通讯,软件主要有三个功能模块,分别是负责RS422链路数据接收的模块,以及数据处理模块,其中:数据接收模块,完成接口属性配置,并接收由RS422接口收到的数据;数据解析模块将RS422接口收到的数据解析成会议纪要中的格式,在接收到一个符合会议纪要中定义长度的数据后,将通知数据处理模块;数据处理模块,根据会议纪要中的描述处理数据。
- 2022-05-06 02:44:42下载
- 积分:1