基于Hadoop架构的文本分类算法
于 2020-12-03 发布
0 117
下载积分: 1
下载次数: 2
代码说明:
基于Hadoop的文本分类算法系统,本系统实现了分词处理,停用词处理(IK);使用朴素贝叶斯分类算法来对文本进行训练和分类,在测试过程中使用词频特征选择作为特征词选择算法,分类准确率达到了78%,包含卡方特征选择算法(训练集特征选择)。
下载说明:请别用迅雷下载,失败请重下,重下不扣分!
发表评论