-
Natural Language processing with python
说明: python自然语言处理的中文翻译
作者: StevenBird, EwanKlein & EdwardLoper
英文出版社:O'REILLY
翻译:陈涛
提供了非常易学的自然语言处理入门介绍,该领域涵盖从文本和电子邮件预测过滤,到自动总结和翻译等多种语言处理技术。在此书中,你将学会编写Python程序处理大量非结构化文本。你还将通过使用综合语言数据结构访问含有丰富注释的数据集,理解用于分析书面通信内容和结构的主要算法。
《Python自然语言处理》准备了充足的示例和练习,可以帮助你:
从非结构化文本中抽取信息,甚至猜测主题或识别“命名实体”;
分析文本语言结构,包括解析和语义分析;
访问流行的语言学数据库,包括WordNet和树库(treebank);
从多种语言学和人工智能领域中提取的整合技巧。(Natural Language processing with python)
- 2018-01-12 17:52:46下载
- 积分:1
-
txtLine
Vb 读取文本数据,每次一行一行显示,以及对文本字符串的分割。(read text data, each party and his party, and the text string segmentation.)
- 2006-11-28 17:04:41下载
- 积分:1
-
VisualC
在Visual C~(++)中使用Unicode编程,世界上有数百种用计算机指定一个数字,来储存字母或其他字符的编码系统。(In Visual C ~(++) use Unicode programming, there are hundreds of the world, with a number assigned to the computer to store letters or other characters in the coding system.)
- 2010-09-03 11:47:29下载
- 积分:1
-
raw
说明: 10个中文分词数据集,用于训练中文分词模型(Ten Chinese Word Segmentation Datasets for Training Chinese Word Segmentation Model)
- 2021-01-06 11:48:53下载
- 积分:1
-
ICTCLASCaller
说明: ICTCLAS的JNI调用接口文件:
Title:ICTCLAS Caller
* <p>Description:do chinese word segmentation.don t change the pakage and CLASS name, orelse you can t use it.
* 请不要改变包名、类名以及native的方法名,否则调用将失效。
* 由于ICTCLAS本身存在很多鲁棒性问题,调用segSentence时,string参数请保证不要过长或带有乱码。调用次数过多(如处理几十G的数据)会有可能造成内存溢出。
* 故基本只能用于较小规模数据(相对几十G来说)。
* 请运行时设置jvm足够的堆栈空间。(ICTCLAS calling the JNI interface documentation : Title : Caller* ICTCLAS)
- 2006-03-03 18:46:02下载
- 积分:1
-
ACWPS
词是最小的能够独立活动的有意义的语言成分。 但汉语是以字为基本的书写单位,词语之间没有明显的区分标记,因此,中文词语分析是中文信息处理的基础与关键。(The word is the smallest independent activities meaningful language component. But Chinese is the word as the basic unit of writing, there is no obvious mark of distinction between the words, so Chinese word analysis is the foundation of Chinese information processing and critical.)
- 2013-04-03 10:22:22下载
- 积分:1
-
m_seq
此函数用来生成最大长度线性移位寄存器序列(m序列)(This function used to generate the maximum length linear shift register sequence (m sequence))
- 2008-05-05 19:37:59下载
- 积分:1
-
tranditionized
中文简繁转换 GreenBrowser/TheWorld2.0插件(Tranditional Chinese Script Conversion GreenBrowser/TheWorld2.0 Plug-in)
- 2010-02-24 19:20:05下载
- 积分:1
-
CIPP_JSsetup
可以实现自动分词功能,支持自动标引,是处理中文自然语言的良好工具(Can achieve automatic word segmentation function, support for automatic indexing is a good tool to deal with Chinese natural language)
- 2020-09-24 19:27:48下载
- 积分:1
-
zhijiehanhua
Directly tool which sinicizes the software
- 2010-07-10 20:00:59下载
- 积分:1