-
问题分类
TF-IDF(term frequency–inverse document frequency)是一种用于资讯检索与资讯探勘的常用加权技术, TFIDF的主要思想是:如果某个词或短语在一篇文章中出现的频率TF高,并且在其他文章中很少出现,则认为此词或者短语具有很好的类别区分能力,适合用来分类。TFIDF实际上是:TF * IDF,TF词频(Term Frequency),IDF反文档频率(Inverse Document Frequency)。TF表示词条在文档d中出现的频率。IDF的主要思想是:如果包含词条t的文档越少,也就是n越小,IDF越大,则说明词条t具有很好的类别区分能力。如果某一类文档C中包含词条t的文档数为m,而其它类包含t的文档总数为k,显然所有包含t的文档数n=m + k,当m大的时候,n也大,按照IDF公式得到的IDF的值会小,就说明该词条t类别区分能力不强。但是实际上,如果一个词条在一个类的文档中频繁出现,则说明该词条能够很好代表这个类的文本的特征,这样的词条应该给它们赋予较高的权重,并选来作为该类文本的特征词以区别与其它类文档。这就是IDF的不足之处。
- 2022-02-24 18:34:48下载
- 积分:1
-
车载诊断源码
关于OBD原理和诊断仪相关源码,包括详细的连接说明,对OBD系统开发以及诊断仪开发有很大的启发,希望与大家多多交流!!
- 2022-07-06 23:21:20下载
- 积分:1
-
有限域上计算的基本库
1引言
这是一种快速Galois域的库,并且所有的源文件是自由软件;这个库有一些显著的不同与以往的Galios场库进行比较。
1)这个库可以使用在Windows平台和Linux平台,C和C++的支持。
2)与以往的研究相比,在这一块的代码非常简洁,代码量小于150线为1/3-1/5以前的作品。
3)所有的Galois域的功能的操作与宏实现的,所以计算速度是非常快的。
2如何使用它。&nbs
- 2022-06-19 21:05:29下载
- 积分:1
-
用MATLAB编写的运用Monte Carlo method数值积分的实例程序。可供初学者参考学习!...
用MATLAB编写的运用Monte Carlo method数值积分的实例程序。可供初学者参考学习!-TETRAHEDRON_MONTE_CARLO is a MATLAB library which estimates the integral of a function over a tetrahedron using the Monte Carlo method.
The library makes it relatively easy to compare different methods of producing sample points in the tetrahedron, and to vary the tetrahedron over which integration is carried out.
- 2022-02-21 17:32:42下载
- 积分:1
-
GN算法java实现
这是一个经典的社团划分,采用GN算法思想,
基本上是从昨天开始吧,着手复杂网络的GN算法,整个过程包括从GML文件中提取邻接矩阵数据,GN算法的实现,模块度的计算。
(1)GML文件的读取。做GN的时候首次知道GML(Graph Model Language),GML (Graph Modelling
Language): There are many different programs that work with graphs but almost
all of them use their own file format. As a consequence, exchanging graphs
between different programs is almost impossible. Simple tasks like exchange of
data, externally reproducible results or a common benchmark suite are much
harder than neccessary.
Therefore, we have developed a new file format for
the Graphlet system: GML. GML supports attaching arbitrary information to
graphs, nodes and edges, and is therefore able to emulate almost every other
format.
从上面的英文中我们可以知道,GML是一种文件格式,试图统一大家对图结构的表达形式。这样,会很方便大家的交互,比如程序的利用。我们主要工作是从GM
- 2022-02-20 11:14:43下载
- 积分:1
-
camera calibration
在opencv下,,对摄像机进行标定。用的是张正友的棋盘标定方法法。
在opencv下,,对摄像机进行标定。用的是张正友的棋盘标定方法法。
在opencv下,,对摄像机进行标定。用的是张正友的棋盘标定方法法。
在opencv下,,对摄像机进行标定。用的是张正友的棋盘标定方法法。
在opencv下,,对摄像机进行标定。用的是张正友的棋盘标定方法法。
希望能够有用吧。。。。。。。。。。。。
- 2022-07-02 15:47:27下载
- 积分:1
-
蚁群算法的java实现
该算法用java程序实现,对传统蚁群算法有一定的改进,不仅使用了轮盘技术而且很大程度上缩短了搜素时间并提高效率,迭代次数减少,有一定的优化。
- 2022-07-20 09:12:23下载
- 积分:1
-
矩阵乘法是线性代数运算中最常见的运算,它在科学研究以及工程开发中都具有举足轻重的作用,提高其运算的效率是很多大型的学术研究中的内容,这边论文是分析主要的两个矩阵...
矩阵乘法是线性代数运算中最常见的运算,它在科学研究以及工程开发中都具有举足轻重的作用,提高其运算的效率是很多大型的学术研究中的内容,这边论文是分析主要的两个矩阵乘法算法.-Linear algebra matrix multiplication is the most common operation, it is in scientific research and engineering development have a decisive role in raising the efficiency of its operations for many large academic research of the contents of papers here is to analyze the main two a matrix multiplication algorithm.
- 2023-05-04 23:35:03下载
- 积分:1
-
神经网络BP改进算法:对开发神经网络BP算法的人员大有帮助
神经网络BP改进算法:对开发神经网络BP算法的人员大有帮助-neural network algorithm improvements : the development of neural network algorithm greatly assist the staff
- 2022-03-24 06:57:51下载
- 积分:1
-
高斯积分算法
近似I=三重积分((f(x,y,z)dz dy dx)),用
- 2022-05-30 23:49:27下载
- 积分:1