登录
首页 » Java开发 » 文本分类

文本分类

于 2022-05-15 发布 文件大小:369.81 kB
0 80
下载积分: 2 下载次数: 1

代码说明:

1.用seg进行分词    输入参数一:输入文本语料所在的文件夹路径。 如  文本文件语料都放在 train//text 文件夹下,则参数为:train//text//* 。 注意:必须每篇文章在一个txt文本中。   输入参数二:输入存储分词后的结果文件所在的文件夹路径:如:result//text。注意:不需要加*   本工具采用了中科院的中文分词工具,ICTCLAS,请自行到ICTCLAS官网下载该工具。并把Data文件夹,Configure.xml,ICTCLAS30.h,ICTCLAS30.lib,ICTCLAS30.dll放在和seg.exe同文件夹下面。 2.getFeature获取特征:输入参数格式如上。   其输入语料为seg分词的结果。   注意:请把ICTCLAS30.dll放在于getFeature.ext同一个文件夹下面 3.getSVMTtrain转化成libSVM的格式   输入参数1:输入文本语料所在的文件夹路径。 如  文本文件语料都放在 train//text 文件夹下,则参数为:train//text//* 。其输入的文件为getFeature后得到的结果。 请点击左侧文件开始预览 !预览只提供20%的代码片段,完整代码需下载后查看 加载中 侵权举报

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论

0 个回复

  • Java游戏源码,蚂蚁迷惑
    Java游戏源码,蚂蚁迷惑,Android游戏源码(依旧以andengine和libgdx开发的为主。话说开源游戏发布者主要集中在欧美用户群中,而欧美那边Java系又主要用这两款引擎)
    2022-02-20 07:03:42下载
    积分:1
  • 管理得当的8皇后问题
    应用背景这是一个正确的执行基数排序的问题。给你的未排序的数据一个非常真诚的、合理的解决方案关键技术采用的技术是很受其影响的基本编程语言调用Java的。它是完全基于逻辑和高效的概念面向对象编程技术具有很高的数据封装和数据完整性问题的解决与减少编译时间和更快的执行时间。
    2022-04-24 02:02:22下载
    积分:1
  • javacode project
    PDAF概率数据关联滤波程序(Matlab-Matlab)- ;
    2023-08-26 05:35:03下载
    积分:1
  • aodroutingprotcol
    即席点播
    2022-01-21 23:05:32下载
    积分:1
  • 数控蛋BOT
    简介:CNC Eggbot当我在这里发现了酷eggbot艺术instructables和egg-bot.com我知道我的下一个小工具将是:-D但我不能花200块钱为它的时刻。所以我决定我自己建了!在接下来的步骤我将简略说明原来的蛋机器人的基本设计,并告诉你我构建它的方法。
    2022-07-06 17:24:35下载
    积分:1
  • kmeans 算法
    这是一种使用距离测量数据点之间的相似度计算方法的聚类算法
    2023-05-14 09:35:03下载
    积分:1
  • 俄罗斯方块的源代码
    下面的源代码是为简单的俄罗斯方块游戏 Java 编写的。两个维度整数数组的包装类。它提供因地制宜的个性化如果一个元素的值等于 0,我们说此元素这种语义是无人占用,如果一个元素的值做不等于 0,我们说此元素被占领。
    2023-04-16 03:30:03下载
    积分:1
  • 基于eclipse编写的ktv管理系统软件
    基于eclipse编写的一款ktv管理系统软件,包含预定管理,宾客开单,消费管理,宾客结算,仓库管理,商品管理, 系统管理等几个大模块。
    2022-10-27 06:55:04下载
    积分:1
  • Java会议室预定系统
    这个是一个会议室预定系统,用Java语言编写,三个会议室,十五个用户,用户可以进行会议室的预定,包括时间,主题,具体的会议室情况等。
    2022-04-10 01:19:00下载
    积分:1
  • Management of registration and payment
    大学的注册和费用支付管理是一个允许管理注册的应用程序。
    2022-03-18 17:43:29下载
    积分:1
  • 696518资源总数
  • 104269会员总数
  • 31今日下载