K-means文本聚类系列
于 2023-02-27 发布
文件大小:100.71 kB
0 43
下载积分: 2
下载次数: 1
代码说明:
实现通用的文本预处理模块。所谓文本预处理包括分词-》去除停用词=》建立词袋子模型=》特征词选择=》建立文档向量模型(VSM)模型。最后将测试文本的VSM模型写成weka所要求的数据格式arff数据格式。我所强调的是提供一个 请点击左侧文件开始预览 !预览只提供20%的代码片段,完整代码需下载后查看 加载中 侵权举报
下载说明:请别用迅雷下载,失败请重下,重下不扣分!
发表评论