登录
首页 » Java开发 » tf-idf Java实现,还是很不错的

tf-idf Java实现,还是很不错的

于 2022-11-20 发布 文件大小:2.37 MB
0 131
下载积分: 2 下载次数: 1

代码说明:

资源描述TF-IDF(term frequency–inverse document frequency)是一种用于资讯检索与资讯探勘的常用加权技术, TFIDF的主要思想是:如果某个词或短语在一篇文章中出现的频率TF高,并且在其他文章中很少出现,则认为此词或者短语具有很好的类别区分能力,适合用来分类。TFIDF实际上是:TF * IDF,TF词频(Term Frequency),IDF反文档频率(Inverse Document Frequency)。TF表示词条在文档d中出现的频率。IDF的主要思想是:如果包含词条t的文档越少,也就是n越小,IDF越大,则说明词条t具有很好的类别区分能力。如果某一类文档C中包含词条t的文档数为m,而其它类包含t的文档总数为k,显然所有包含t的文档数n=m + k,当m大的时候,n也大,按照IDF公式得到的IDF的值会小,就说明该词条t类别区分能力不强。但是实际上,如果一个词条在一个类的文档中频繁出现,则说明该词条能够很好代表这个类的文本的特征,这样的词条应该给它们赋予较高的权重,并选来作为该类文本的特征词以区别与其它类文档。这就是IDF的不足之处。这里采用了外部插件IKAnalyzer-2012.jar,用其进行分词,插件和测试文件可以从这里下载

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论

0 个回复

  • 图书馆管理系统
    全方位的图书馆管理系统,VB 源码,书面的也可以用,请支持!!!全方位的图书馆管理系统,VB 源码,书面的也可以用,请支持!!!...
    2022-07-17 08:04:20下载
    积分:1
  • 人力资源管理系统
    资源描述简单的人力资源管理系统。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。
    2022-02-02 19:59:13下载
    积分:1
  • 广场 & 广场
    其两个玩家游戏使用鼠标。在开始它也采取的两个球员的名字和颜色的选择。名称提及上他们也表明
    2022-03-21 15:34:47下载
    积分:1
  • Autamação 不动产 com 泽西 e · 杰克逊
    Dispositivo 段 automação 不动产 usando 宁静泽西 com json 杰克逊 Voce 普德 instanciar vários sensores que irão enviar dados 段 o servidor 杜兰特 intervalo determinado。 O servidor ficará em determinado intervalo tirando média de 托 os valores recebidos dos sensores。 德方面 com média o servidor irá atualizar os valores 做 radiador。 户田 comunicação será realizada usando rest 风格 com json,泽西/杰克逊。
    2023-07-24 15:50:04下载
    积分:1
  • 一方面系模式识别系统
    handwrittern模式识别软件是一种软件,编写英文字符识别方面,打印在打印格式。该软件 ;有一个训练数据集训练模块,分类 分类模块;以及识别识别模块。
    2022-04-12 22:05:01下载
    积分:1
  • 在线旅游与旅游管理
    这个项目提供了用户在线注册,他们可以看到旅游景点和类别。他们可以在线订票。
    2023-05-01 07:55:09下载
    积分:1
  • 影院订票系统
    应用背景不错的资源,大家一起来学习不错的资源,大家一起来学习不错的资源,大家一起来学习不错的资源,大家一起来学习不错的资源,大家一起来学习不错的资源,大家一起来学习不错的资源,大家一起来学习不错的资源,大家一起来学习不错的资源,大家一起来学习关键技术运用javaee,进行一定的编写运用javaee,进行一定的编写运用javaee,进行一定的编写运用javaee,进行一定的编写运用javaee,进行一定的编写运用javaee,进行一定的编写运用javaee,进行一定的编写运用javaee,进行一定的编写
    2022-09-04 23:40:05下载
    积分:1
  • BBS论坛项目源码
    资源描述1、jsp+hibernate+Struts2+spring+ajax+jQuery 2、用到了Java面向对象的特征 3、使用的oracle的数据库
    2022-07-12 12:53:41下载
    积分:1
  • 微信企业号,接口源码,所有接口都已调试通了
    应用背景微信企业号接口源码,通讯录:1.部门接口 2.成员接口 3.标签接口 。 获取token接口,二次验证接口,判断是不是在微信端接口。还有一些常用的工具类。开发文档里面有的都已经写好了。就等着你去实现。关键技术腾讯微信企业号开发文档。开发文档里面都有说明。
    2022-03-24 11:02:45下载
    积分:1
  • 企业人事管理系统
    (一)普通管理员的权限:  普通管理员应当具有所有的权限,这包括:     (1)人事管理:新员工进入企业时,为其建立人事档案;员工信息变动时,可以修改档案信息;查看公司所有人的档案信息;当员工离职时,删除一个人的信息;发生人事调动时,可以添加人员调动信息,以备日后查询。         (2)考勤模块:  员工上下班时要进行签到签出,系统根据签到时间确定其是否迟到。     (3)奖惩模块:  由管理员进行员工奖惩信息的添加、修改、删除。     (4)工资模块:  员工的工资由基本工资、迟到缺勤罚款、奖惩金额确定。基本工资根据员工的级别划分,迟到一次罚款100,奖惩由员工奖励和惩罚计算得出,最终的工资根据所有信息自动计算。    (二)超级管理员的权限:  管理员除具备普通员工的权限外,还具有以下权限:
    2022-03-21 21:52:49下载
    积分:1
  • 696518资源总数
  • 105678会员总数
  • 22今日下载