登录

最新会员 最新下载

成为了本站VIP会员

12月25日 15:38

成为了本站VIP会员

12月25日 12:28

成为了本站VIP会员

12月25日 12:10

成为了本站VIP会员

12月24日 23:54

成为了本站VIP会员

12月24日 23:29

成为了本站VIP会员

12月21日 19:40
已选条件
  1. 编程语言:所有
  2. 代码类别:数据挖掘
  3. 发布时间:一月内
全部撤销
编程语言 更多 收起
代码类别 更多 收起
发布时间
更多选项

1. 频繁项集算法--FPGROWTH算法

数据挖掘经典算法,频繁项集挖掘经典算法,FPGROWTH算法,源码中有详细说明

1
下载
241
浏览
2023-06-08发布

2. weka源代码

weka是一个很优秀的数据挖掘软件,可以把weka作为程序包打入工程中,基本想要的功能很快就能实现

1
下载
179
浏览
2023-06-01发布

3. 频繁项集算法--CFPGROWTH算法

数据挖掘经典算法,频繁项集挖掘经典算法,CFPGROWTH算法,JAVA实现,代码中有详细注释

1
下载
138
浏览
2023-03-29发布

4. 高效用项集算法--HUIMINER算法

数据挖掘算法,高效用项集挖掘算法,加权频繁项集挖掘,HUIMINER算法,源码中有详细注释

1
下载
161
浏览
2023-02-10发布

5. 频繁项集算法--TWOPHASE算法

数据挖掘经典算法,频繁项集挖掘经典算法,TWOPHASE算法,源码中有详细注释

1
下载
175
浏览
2022-10-13发布

6. Java实现Apriori算法

Java实现Apriori数据挖掘算法,包内还有实例用的数据库 Apriori数据挖掘算法:先找出所有的频集,这些项集出现的频繁性至少和预定义的最小支持度一样。然后由频集产生强关联规则,这些规则必须满足最小支持度和最小可信度。然后使用第1步找到的频集产生期望的规则,产生只包含集合的项的所有规则,其中每一条规则的右部只有一项,这里采用的是中规则的定义。一旦这些规则被生成,那么只有那些大于用户给定的最小可信度的规则才被留下来。为了生成所有频集,使用了递归的方法。 请在jbuilder下编译 配好JDBC驱动 商品如果 买的表示为大写 没买表示为小写的 具体看GetSource.java

1
下载
159
浏览
2022-10-02发布

7. 带阻尼参的pagerank实现

资源描述实现基本的pagerank算法,可实现传递阻尼参数和迭代次数。源文件从文件中读取

1
下载
172
浏览
2022-09-10发布

8. 微博

利用python调用新浪api接口实现的新浪微博数据的挖掘,能够获取指定的经纬度地点的微博动态信息,还能够将其写入MySQL数据库中。

1
下载
191
浏览
2022-07-12发布

9. 算法

包含很多知名算法实现,支持向量机,决策树,粗糙集,贝叶斯分类器等,适合学术研究,短评论意见挖掘,文本分类等。

1
下载
187
浏览
2022-06-03发布

10. 频繁项集算法

频繁项集挖掘算法,能在大量局部特征中发现频繁空间配置,这些空间配置可以作为词语,加入到特征包中进行分类,实现图像分类。

1
下载
203
浏览
2022-03-23发布

11. k-means java实现 Iris四大

通过优化的k-means算法 采用了密度和优化评测函数实现了对Iris等数据集的聚类。 

1
下载
185
浏览
2022-03-18发布

12. 决策树Java源代码

资源描述决策树是建立在信息论基础之上,对数据进行分类挖掘的一种方法。其思想是,通过一批已知的训练数据建立一棵决策树,然后利用建好的决策树,对数据进行预测。决策树的建立过程可以看成是数据规则的生成过程。由于基于决策树的分类方法结构简单,本身就是人们能够理解的规则。其次,决策树方法计算复杂度不大,分类效率高,能够处理大数据量的训练集;最后,决策树方法的分类精度较高,对噪声数据有较好的健壮性,符合一般系统的要求。

1
下载
189
浏览
2022-03-12发布

13. Ecalt算法

Eclat算法是一种深度优先算法,采用垂直数据表示形式,在概念格理论的基础上利用基于前缀的等价关系将搜索空间(概念格)划分为较小的子空间(子概念格)。Eclat算法采用方法二计算支持度。对候选k项集进行支持度计算时,不需再次扫描数据库,仅在一次扫描数据库后得到每个1项集的支持度,而候选k项集的支持度就是在对k-1项集进行交集操作后得到的该k项集Tidset中元素的个数。本算法利用diffset数据格式实现。

1
下载
172
浏览
2022-03-02发布

14. 中编写C语言程序预处理,读取文本文件中的,使用链表,并输出该组的按平均值、中值、边界值平滑的结果。若分箱时缺失则用最后的值复制代替,还要找出程序中

数据挖掘中编写C语言程序数据预处理,读取文本文件中的数据,使用链表,并输出该组数据的按平均值、中值、边界值平滑的结果。若分箱时数据缺失则用最后的值复制代替,还要找出程序中的离群点,要求程序符合结构化程序设计风格,关键地方需加注释。完美实现!

2
下载
191
浏览
2022-02-28发布

15. python 实现随机森林

应用背景 数据   :两个月之内 40000个客户的15个数据字段   包含客户的 地          理位置,职业,职级,年收入,。。。。。。    购买过得产品 目的:对新客户进行推荐一个适合该客户的产品, 对老客户推荐可能再购买的产品 数据处理    数据清洗:   describe 每个特征统计分析       方差     -分析缺陷特征和波动性                 空值赋值为  “-1 “              -  保证模型的可使用    数据归一化:eg:邮编 相似度不高 根据一线二线….进行划分  – 特征的重要性 关键技术特征选择    随机森林:  判断特征的重要性 :思考为何重要性高     AHP    :  迭代设置每个特征的权重 模型选择   :根据数据量数量,是否有标签,分类or回归选取 关于模型选择时候我想用协同过滤  但是不知道关于特征的协同过滤是怎么执行的   是每个特征都有一个评分构成评价矩阵么?

2
下载
186
浏览
2022-02-25发布

16. 文本分类(采用Java语言)

资源描述利用分类算法实现对文本的数据挖掘,主要包括: 1. 语料库的构建,主要包括利用爬虫收集Web文档等; 2. 语料库的数据预处理,包括文档建模,如去噪,分词,建立数据字典, 使用词袋模型或主题模型表达文档等; 注:使用主题模型,如LDA可以获得实验加分; 3. 选择分类算法(如朴素贝叶斯、SVM等),训练文本分类器,理解所选 的分类算法的建模原理、实现过程和相关参数的含义; 4. 对测试集的文本进行分类 5. 对测试集的分类结果利用正确率和召回率进行分析评价。 

1
下载
203
浏览
2022-02-13发布

17. 朴素贝叶斯分类

朴素贝叶斯分类的分类器实现,使用的是matlab语言。内含测试集和训练集,可直接运行,readme.txt文件中说明了数据格式

3
下载
221
浏览
2022-02-07发布

18. 关于大的相关论文

关于大数据的论文,对稀疏表示分类有很大的帮助,希望对初学者哟帮助

1
下载
202
浏览
2022-02-06发布

19. 高效用项集算法--HMINE算法

数据挖掘算法,高效用项集挖掘算法,加权频发项集挖掘算法,HMINE算法,源码中有详细注释

1
下载
201
浏览
2022-02-04发布

20. 频繁子图算法pafi1.0.1.zip

频繁子图挖掘算法pafi1.0.1.zip,频繁子图挖掘算法采用c++实现,图数据挖掘方向的可以看一看。

1
下载
191
浏览
2022-01-21发布