登录
首页 » 算法 » 问题分类

问题分类

于 2022-02-24 发布 文件大小:1.82 MB
0 65
下载积分: 2 下载次数: 1

代码说明:

TF-IDF(term frequency–inverse document frequency)是一种用于资讯检索与资讯探勘的常用加权技术, TFIDF的主要思想是:如果某个词或短语在一篇文章中出现的频率TF高,并且在其他文章中很少出现,则认为此词或者短语具有很好的类别区分能力,适合用来分类。TFIDF实际上是:TF * IDF,TF词频(Term Frequency),IDF反文档频率(Inverse Document Frequency)。TF表示词条在文档d中出现的频率。IDF的主要思想是:如果包含词条t的文档越少,也就是n越小,IDF越大,则说明词条t具有很好的类别区分能力。如果某一类文档C中包含词条t的文档数为m,而其它类包含t的文档总数为k,显然所有包含t的文档数n=m + k,当m大的时候,n也大,按照IDF公式得到的IDF的值会小,就说明该词条t类别区分能力不强。但是实际上,如果一个词条在一个类的文档中频繁出现,则说明该词条能够很好代表这个类的文本的特征,这样的词条应该给它们赋予较高的权重,并选来作为该类文本的特征词以区别与其它类文档。这就是IDF的不足之处。

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论

0 个回复

  • 串行口升级子程序支持1
    串行口升级子程序支持1-4口的中断控制  -serial port upgrade 1-4 subroutine I support the Interrupt Control
    2022-11-21 09:15:03下载
    积分:1
  • 2阶巴特沃斯滤波器
    实用的fortran版2阶巴特沃斯滤波器。 在李建平程序基础上有细微调整。
    2022-03-09 12:24:15下载
    积分:1
  • 多项式的编程另一种
    多项式的编程另一种算法-polynomial another programming algorithm
    2022-06-03 01:27:43下载
    积分:1
  • MCF52259的GPIO口使用——LED点亮
    这个是用来GPIO口的使用,可以提供更多初学者初次使用,了解IO口配置,简单入门
    2022-01-26 05:58:57下载
    积分:1
  • 苏州大学研究生复试机试代码
    苏州大学研究生复试机试代码,包含2008-2013年代码,已经过测试,适合参加考研的同学使用,另有2014年真题,与2012年第一问相同,第二问为给出一个点坐标,求有效点中距离给定点距离最近的k个点,并且显示着k个点的坐标。以及写入文件
    2022-03-24 17:46:40下载
    积分:1
  • 子列表代码 c + +
    这个程序基于切削功率用括号将其发送给一个字符串并将其传递到一个列表中的信息和 然后阅读其他信息放在创建所有的列表的子列表的基础如何动态的 c + +
    2022-06-19 12:10:36下载
    积分:1
  • School operations, the mine self
    学校作业,自编的扫雷代码,能实现扫雷游戏的基本操作-School operations, the mine self-compiled code, can achieve the basic operation of the game de-mining
    2022-06-21 06:53:10下载
    积分:1
  • 线性方程迭代,下载的顶一下哦
    线性方程迭代法,下载的顶一下哦-Linear equations iterative method, download the top click oh
    2022-11-01 13:05:03下载
    积分:1
  • Simulation Algorithm. By compiling and debugging a system dynamic allocation of...
    模拟实现银行家算法。通过编写和调试一个系统动态分配资源的简单模拟程序,观察死锁产生的条件,并采用银行家算法,有效的避免死锁。-Simulation Algorithm. By compiling and debugging a system dynamic allocation of resources simple process simulation, the observation Deadlock conditions, and using bankers algorithm, effective avoid deadlock.
    2022-04-22 19:46:44下载
    积分:1
  • 本论文建立了校园卡充值点安排方案的最优化模型 建立“0
    本论文建立了校园卡充值点安排方案的最优化模型 建立“0-1”模型,使用“启发式贪婪算法”,运用Lingo软件计算出三个最优点。 -In this paper, the establishment of a campus card program arrangements recharge point optimization model to establish a
    2022-01-26 00:40:51下载
    积分:1
  • 696518资源总数
  • 104269会员总数
  • 31今日下载