登录
首页 » Java开发 » 文本分类

文本分类

于 2022-05-15 发布 文件大小:369.81 kB
0 91
下载积分: 2 下载次数: 1

代码说明:

1.用seg进行分词    输入参数一:输入文本语料所在的文件夹路径。 如  文本文件语料都放在 train//text 文件夹下,则参数为:train//text//* 。 注意:必须每篇文章在一个txt文本中。   输入参数二:输入存储分词后的结果文件所在的文件夹路径:如:result//text。注意:不需要加*   本工具采用了中科院的中文分词工具,ICTCLAS,请自行到ICTCLAS官网下载该工具。并把Data文件夹,Configure.xml,ICTCLAS30.h,ICTCLAS30.lib,ICTCLAS30.dll放在和seg.exe同文件夹下面。 2.getFeature获取特征:输入参数格式如上。   其输入语料为seg分词的结果。   注意:请把ICTCLAS30.dll放在于getFeature.ext同一个文件夹下面 3.getSVMTtrain转化成libSVM的格式   输入参数1:输入文本语料所在的文件夹路径。 如  文本文件语料都放在 train//text 文件夹下,则参数为:train//text//* 。其输入的文件为getFeature后得到的结果。 请点击左侧文件开始预览 !预览只提供20%的代码片段,完整代码需下载后查看 加载中 侵权举报

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论

0 个回复

  • 企业通讯录系统
    资源描述 通讯录系统 添加联系人 删除联系人 修改联系人 联系人分类
    2022-01-24 12:45:46下载
    积分:1
  • 休假管理系统
    应用背景包javaui.javaclasses;进口java.io.serializable;进口java.sql.resultset;难道是进口的;进口java.util.arraylist;“suppresswarnings(系列)公共课嘘关键技术网上购物是购买商品的过程和服务从商人在互联网。自从世界的出现万维网,商人们一直试图把他们的产品卖给那些花时间的人在线。消费者可以从他们的家和商店的舒适中访问网络商店当他们坐在电脑前。网上购物已普及多年来,主要是因为人们发现它方便和易于交易从他们的家或办公室的舒适店。最诱人的因素之一关于网上购物,特别是在假日季节,是缓解需要等待从长行或从商店寻找一个特定的项目。消费者可以买到各种各样的物品网上商店,和任何东西都可以从公司购买提供他们的产品在线。书籍,服装,家用电器,玩具,硬件,软件和健康保险只是一些数百产品消费者可以从网上商店购买。
    2022-08-10 20:46:01下载
    积分:1
  • jsp 网上购物系统
    jsp做的网络购物系统 功能全面 有用户界面和管理界面 供大家学习哦 jsp do online shopping system is fully functional user interface and management interface for all learning oh
    2022-07-27 08:02:53下载
    积分:1
  • Java 调用C/C++说明
    资源描述java调用C/C++技术指南,详细的描述了Java如何调用C++的方法,非常实用,适合初学者
    2022-08-18 02:56:12下载
    积分:1
  • Mahout 源代码
    Apache Mahout 是为分布式/非分布式编程提供了足够的框架实用开放源码机器学习图书馆。它具有可扩展性,并可以处理大量的数据相比,其他机器学习框架。Apache Mahout 是 Apache Hadoop 项目之一。Mahout 包含三种类型的算法: 推荐系统 (专门协同过滤)、 聚类和分类。推荐系统的实现可进一步分为非分布式方法和分布式的方法。推荐系统的分布式实现之一使用 MapReduce,这是可扩展性,适用于处理大规模、 分布式的数据集。其可伸缩性和专注于真实世界的应用程序做出 Mahout 越来越受欢迎的选择为组织设法利用大型机器 Learning.The Apache Mahout 体系结构提供了一套丰富的组件,从中我们可以构建一个自定义的推荐系统选择的算法。Mahout 设计为企业准备用于性能、 可扩展性和灵活性。顶层的包定义了 Apache Mahout 接口,对这些关键的抽象,[] 是: · DataModel· UserSimilarity· ItemSimilarity· UserNeighborhood· 推荐
    2022-08-05 12:06:52下载
    积分:1
  • 文本分类
    1.用seg进行分词    输入参数一:输入文本语料所在的文件夹路径。 如  文本文件语料都放在 train//text 文件夹下,则参数为:train//text//* 。 注意:必须每篇文章在一个txt文本中。   输入参数二:输入存储分词后的结果文件所在的文件夹路径:如:result//text。注意:不需要加*   本工具采用了中科院的中文分词工具,ICTCLAS,请自行到ICTCLAS官网下载该工具。并把Data文件夹,Configure.xml,ICTCLAS30.h,ICTCLAS30.lib,ICTCLAS30.dll放在和seg.exe同文件夹下面。 2.getFeature获取特征:输入参数格式如上。   其输入语料为seg分词的结果。   注意:请把ICTCLAS30.dll放在于getFeature.ext同一个文件夹下面 3.getSVMTtrain转化成libSVM的格式   输入参数1:输入文本语料所在的文件夹路径。 如  文本文件语料都放在 train//text 文件夹下,则参数为:train//text//* 。其输入的文件为getFeature后得到的结果。 请点击左侧文件开始预览 !预览只提供20%的代码片段,完整代码需下载后查看 加载中 侵权举报
    2022-05-15 15:25:33下载
    积分:1
  • 安卓室内定位
    利用室内环境中的Wi-Fi无线接入点(AP)的信号强度与物理位置直接或间接的映射关系,使用装有Android操作系统的智能手机作为服务器、客户端和数据库,通过在待测目标处采集到的无线AP 信号与指纹数据库进行匹配,从而估算目标位置。设计一款智能终端无线定位程序。在Wi-Fi环境下通过采集无线AP在室内的信号分布建立指纹数据库,通过将智能终端检测待测点的信号并与指纹库比对,从而实现近似定位。
    2022-02-07 07:10:01下载
    积分:1
  • java实现搜索功能
    通过java来实现搜索功能,并能够点击搜索到的文件路径来打开文件,就想百度链接一样,通过输入字符,能够将系统中所有包含字符的文件列出来,并且显示的文件路径是网络链接的形式。
    2022-05-10 23:02:11下载
    积分:1
  • jsp都市信息供求网.zip
    jsp都市信息供求网是一个简单的信息供求发布网站,内含对信息的查询,发布,后台管理等功能,利用最新的技术,struts2,spring,hibernate技术,使用mysql数据库,能让您在短时间内学会最新的技术,二次开发成本大大降低
    2022-07-22 05:57:12下载
    积分:1
  • JDK日志框架扩展
    日志记录对于软件的维护特别是对于已部署到运行环境之后的软件调试都有着重要的意义。本文介绍了 JDK 的日志框架,以及如何根据不同需求自定义日志处理、消息格式化、消息级别等组件。最后阐述了如何利用 JDK 日志框架的扩展能力将 Java 程序能够通过 STAF(Software Testing Automation Framework,一种自动化测试框架)日志服务来进行监视。
    2022-07-12 11:56:38下载
    积分:1
  • 696518资源总数
  • 104349会员总数
  • 32今日下载