登录
首页 » Python » HMM

HMM

于 2019-04-07 发布
0 256
下载积分: 1 下载次数: 5

代码说明:

说明:  HMM中文分词,基于隐马尔科夫模型 。需要进行训练后试验(Word Segmentation Based on Hidden Markov Model)

文件列表:

test, 0 , 2019-03-28
test\README.txt, 70 , 2019-03-28
test\testset.txt, 759964 , 2018-05-19
test\trainingset.txt, 8442480 , 2018-05-19
seg_hw.py, 13531 , 2019-03-26

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论


0 个回复

  • GB2312ToUnicode
    GBK 转 unicode 提供二分法查询(translate the gbk to the unicode,with the bianary search way)
    2009-12-31 13:17:44下载
    积分:1
  • Reader
    在中文分词之前,要对文档进行读取,本代码是实现了从磁盘读取的任务。(In the Chinese word prior to reading the document, the code is read from the disk to achieve the task.)
    2013-09-10 11:09:28下载
    积分:1
  • ppp
    说明:  各种去电离层相位污染算法的比较,文章提到了各种不同的算法以及不同算法的性能比较包括PWVD 最大熵法,相位分段多项式法等(Comparison and anyalysis of ionospheric phase decontamination methods for backscattered signals)
    2009-08-14 12:51:39下载
    积分:1
  • raw
    说明:  10个中文分词数据集,用于训练中文分词模型(Ten Chinese Word Segmentation Datasets for Training Chinese Word Segmentation Model)
    2021-01-06 11:48:53下载
    积分:1
  • pipe
    这可是全球著名IT公司ILog的APS高级排产优化引擎,就连SAP、Oracle等ERP中的物料需求计划与生产计划算法都来源于ILog。我研究了好久,中间的性线求解算法可真谓难呀。(This is the world s leading IT companies ILog the APS Senior Scheduling optimization engine, and even SAP, Oracle and other ERP s MRP and production planning algorithm are derived from the ILog. I have studied for a long time, Central and line algorithm that can be really difficult for me.)
    2008-04-27 23:08:23下载
    积分:1
  • luyfSearch2.0.tar
    一个中文分词开发包,可以用到搜索引擎的开发当中,比较好用。(A Chinese word segmentation development kit, you can use search engine in development and are relatively easy to use.)
    2009-11-05 10:09:53下载
    积分:1
  • HMM
    说明:  HMM中文分词,基于隐马尔科夫模型 。需要进行训练后试验(Word Segmentation Based on Hidden Markov Model)
    2019-04-07 11:58:08下载
    积分:1
  • ICTCLASCaller
    说明:  ICTCLAS的JNI调用接口文件: Title:ICTCLAS Caller * <p>Description:do chinese word segmentation.don t change the pakage and CLASS name, orelse you can t use it. * 请不要改变包名、类名以及native的方法名,否则调用将失效。 * 由于ICTCLAS本身存在很多鲁棒性问题,调用segSentence时,string参数请保证不要过长或带有乱码。调用次数过多(如处理几十G的数据)会有可能造成内存溢出。 * 故基本只能用于较小规模数据(相对几十G来说)。 * 请运行时设置jvm足够的堆栈空间。(ICTCLAS calling the JNI interface documentation : Title : Caller* ICTCLAS)
    2006-03-03 18:46:02下载
    积分:1
  • wordsegmentation
    一种基于自动机的分词方法,可进行中文分词及统计(Based method of automatic machine word)
    2011-09-21 11:38:57下载
    积分:1
  • m_seq
    此函数用来生成最大长度线性移位寄存器序列(m序列)(This function used to generate the maximum length linear shift register sequence (m sequence))
    2008-05-05 19:37:59下载
    积分:1
  • 696518资源总数
  • 104627会员总数
  • 23今日下载