中文分词系统
于 2022-09-01 发布
文件大小:6.58 MB
0 47
下载积分: 2
下载次数: 1
代码说明:
利用哈希表创建词表,利用正向最大匹配算法和逆向最大匹配算法实现中文分词,逐行读入,在哈希词表中查找最大长度的词,采用的编码格式为GBK码,哈希表查找的复杂度O(1),效率比较高,适用于此次试验的大量数据查找匹配。
下载说明:请别用迅雷下载,失败请重下,重下不扣分!
发表评论