-
ACWPS
词是最小的能够独立活动的有意义的语言成分。 但汉语是以字为基本的书写单位,词语之间没有明显的区分标记,因此,中文词语分析是中文信息处理的基础与关键。(The word is the smallest independent activities meaningful language component. But Chinese is the word as the basic unit of writing, there is no obvious mark of distinction between the words, so Chinese word analysis is the foundation of Chinese information processing and critical.)
- 2013-04-03 10:22:22下载
- 积分:1
-
HMM
说明: HMM中文分词,基于隐马尔科夫模型 。需要进行训练后试验(Word Segmentation Based on Hidden Markov Model)
- 2019-04-07 11:58:08下载
- 积分:1
-
ppp
说明: 各种去电离层相位污染算法的比较,文章提到了各种不同的算法以及不同算法的性能比较包括PWVD 最大熵法,相位分段多项式法等(Comparison and anyalysis of ionospheric
phase decontamination methods for backscattered signals)
- 2009-08-14 12:51:39下载
- 积分:1
-
Natural Language processing with python
说明: python自然语言处理的中文翻译
作者: StevenBird, EwanKlein & EdwardLoper
英文出版社:O'REILLY
翻译:陈涛
提供了非常易学的自然语言处理入门介绍,该领域涵盖从文本和电子邮件预测过滤,到自动总结和翻译等多种语言处理技术。在此书中,你将学会编写Python程序处理大量非结构化文本。你还将通过使用综合语言数据结构访问含有丰富注释的数据集,理解用于分析书面通信内容和结构的主要算法。
《Python自然语言处理》准备了充足的示例和练习,可以帮助你:
从非结构化文本中抽取信息,甚至猜测主题或识别“命名实体”;
分析文本语言结构,包括解析和语义分析;
访问流行的语言学数据库,包括WordNet和树库(treebank);
从多种语言学和人工智能领域中提取的整合技巧。(Natural Language processing with python)
- 2018-01-12 17:52:46下载
- 积分:1
-
GB2312
列出gbk2312中的每一个字符,并给出对应的编号(Listed gbk2312 in each character, and gives the corresponding number)
- 2012-07-04 16:07:46下载
- 积分:1
-
usart
this is some code fjhg ldfh ldfgh ldfkjhg dlkjfhg dlkf gdlkf g
- 2017-05-25 05:34:16下载
- 积分:1
-
raw
说明: 10个中文分词数据集,用于训练中文分词模型(Ten Chinese Word Segmentation Datasets for Training Chinese Word Segmentation Model)
- 2021-01-06 11:48:53下载
- 积分:1
-
NewWebSite
HTML/CSS responsive website. Free to personal or profesional use. If user want to develop or help, contact me.
- 2017-02-28 20:25:00下载
- 积分:1
-
hanziinput
实现按照拼音输入汉字;
功能详尽,有使用例程;
(Realized in accordance with the Pinyin input Chinese characters
Features detailed, there is the use of routine )
- 2014-09-15 16:04:59下载
- 积分:1
-
1234568
中文信息逆向分词程序 是用api实现的(Chinese Information reverse segmentation process is achieved by api)
- 2008-12-20 22:47:31下载
- 积分:1