基于正向最大匹配法原理的中文分词
于 2022-04-30 发布
文件大小:791.91 kB
0 49
下载积分: 2
下载次数: 1
代码说明:
分词方法总体上分为两类,一是非基于词典的分词,相当于人工智能领域计算。一般用于机器学习,特定领域等方法,这种在特定领域的分词可以让计算机在现有的规则模型中,推理如何分词,精确度较高,实现相对复杂。二是基于词典的分词,是最常见的分词方法,具体算法有正向最大匹配法(FMM)、逆向最大匹配法(RMM)和双向最大匹配法(BM)。本文在学习正向最大匹配算法的同时,用Python进行分词实现。本文使用的是 请点击左侧文件开始预览 !预览只提供20%的代码片段,完整代码需下载后查看 加载中 侵权举报
下载说明:请别用迅雷下载,失败请重下,重下不扣分!
发表评论