登录
首页 » 算法 » 问题分类

问题分类

于 2022-02-24 发布 文件大小:1.82 MB
0 91
下载积分: 2 下载次数: 1

代码说明:

TF-IDF(term frequency–inverse document frequency)是一种用于资讯检索与资讯探勘的常用加权技术, TFIDF的主要思想是:如果某个词或短语在一篇文章中出现的频率TF高,并且在其他文章中很少出现,则认为此词或者短语具有很好的类别区分能力,适合用来分类。TFIDF实际上是:TF * IDF,TF词频(Term Frequency),IDF反文档频率(Inverse Document Frequency)。TF表示词条在文档d中出现的频率。IDF的主要思想是:如果包含词条t的文档越少,也就是n越小,IDF越大,则说明词条t具有很好的类别区分能力。如果某一类文档C中包含词条t的文档数为m,而其它类包含t的文档总数为k,显然所有包含t的文档数n=m + k,当m大的时候,n也大,按照IDF公式得到的IDF的值会小,就说明该词条t类别区分能力不强。但是实际上,如果一个词条在一个类的文档中频繁出现,则说明该词条能够很好代表这个类的文本的特征,这样的词条应该给它们赋予较高的权重,并选来作为该类文本的特征词以区别与其它类文档。这就是IDF的不足之处。

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论


0 个回复

  • LUHN
    LUHN算法-LUHN algorithm
    2022-08-22 15:41:47下载
    积分:1
  • ssc-i2s-project-at91sam3u-ek-gnu
    SAM3U4E 可编程时钟输出用于生成 WM8731 主时钟 (MCLK)。的 SAM3U4E ODT (上模终止) 功能可保证无此时钟线上的信号完整性 需要外部的分立元件。 WM8731 pin 21 模式被推倒,默认情况下 ;这配置该设备,作为一种 TWI 装置内部 注册访问。 公务员事务局 Pin15 是把拉出来,而将其 TWI 地址设置为 33 [0x0011011]。 WM8731 数字接口在 SAM3U4E 同步串行控制器上的奴隶模式下工作 (SSC) 接口,这意味着编解码器的数字音频位 ADC/DAC 左/右控制和时钟是 要生成的 SAM3U4E。
    2023-08-05 19:35:04下载
    积分:1
  • Data Detection
    在本文中,我们采用双阈值法在能量检测器进行频谱感知,而认知无线电网络中的融合中心将收集的本地的决定和观测值的次要的用户,然后作最后的决定,以确定主用户是否缺席或不。仿真结果将显示根据拟议的计划,而不是常规的方法大大提高了频谱感知性能的渠道。
    2022-06-29 22:58:18下载
    积分:1
  • 该程序用来处理微分方程系统的,用来化简一个微分系统的,特别是高维的系统,用来计中心流行...
    该程序用来处理微分方程系统的,用来化简一个微分系统的,特别是高维的系统,用来计算中心流行-The procedures used to deal with differential equations system for the simplification of a differential system, especially high-dimensional system, used to pop Center
    2022-12-11 14:40:03下载
    积分:1
  • 文化基因伪代码
    memetic是一种高效的文化进化计算方法,该范例以Rosenbroek函数为例进行了演示,你也可以加入其它函数进行测试。-memetic cultural evolution is an efficient method of calculating the sample to Rosenbroek function as an example of the presentation, you can also add other functions to be tested.非原创,仅限分享。
    2022-10-13 04:35:03下载
    积分:1
  • 牛顿插值的差商迭代,c语言实现
    牛顿插值的差商迭代算法,c语言实现-Newton interpolation algorithm to worse, the C Language
    2022-03-15 21:33:46下载
    积分:1
  • 采用自适应预失真对三种调制方式APSK、 PSK、 QAM进行性能分析
    采用自适应预失真算法对三种调制方式APSK、 PSK、 QAM进行性能分析;包含系统参数设置; 16APSK信源产生模块; 16QAM信源产生模块;16PSK信号产生模块;IFFT处理模块;经过预失真器再放大; 植入噪声;解调模块模块。 另外,版本是2010,仿真时间较长,耐心等待结果
    2022-01-22 08:26:01下载
    积分:1
  • 钢筋混凝土截面分析
    RCSA是一个互动的微机程序开发是为了提供一个实用,可靠的部分分析工具来预测深或法兰RC的回应部分。现有程序的某些组件,UNCOLA,这是在美国加州大学开发,伯克利,被纳入RCSA。与RCSA一个人能够的预应力进行分析,钢筋混凝土,或根据任何任何极限状态下的复合节指定加载历史。该方案利用了层,或长丝,方法,离散的一部分。假设在分析如下:(1)部分必须通过对称由单向轴向轴装力,弯曲和剪切; (2)任何类型的用户定义应变分布,以及伯努利-Nairer假说,可以被实现。即使是“粘结滑移”或“剪切滞后”可能通过对钢铁正确界定应变系数模拟或混凝土的纤维和/或长丝; (3)剪切力和/或剪切变形关系不明确包括;然而,剪切对轴向弯曲的效果响应可以通过一个等效双轴考虑响应混凝土;钢之间(4)完善债券具体的存在,除非确定采用防滑防滑因素,个别酒吧; (5)精细裂纹和可能存在作为初始条件可以是显微裂纹通过修改混凝土材料占性能; (六)其他初始应力和/或粘结滑移其可存在的建筑或固化的结果影响忽略不计。中钢最初的预应力效应如果指定的预应力和一个可并入使用双线性模型钢。
    2022-03-18 16:42:36下载
    积分:1
  • A* search technique implementation code
    这是实现a*(a星)搜索算法的Jave代码。代码经过测试,是确定的;
    2022-03-25 08:29:22下载
    积分:1
  • bit operation for 64.
    bit operation for 64.
    2022-12-15 05:30:03下载
    积分:1
  • 696518资源总数
  • 104544会员总数
  • 20今日下载