-
关于大数据的相关论文
关于大数据的论文,对稀疏表示分类有很大的帮助,希望对初学者哟帮助
- 2022-02-06 00:21:30下载
- 积分:1
-
频繁项集挖掘算法
频繁项集挖掘算法,能在大量局部特征中发现频繁空间配置,这些空间配置可以作为词语,加入到特征包中进行分类,实现图像分类。
- 2022-03-23 21:38:47下载
- 积分:1
-
数据挖掘算法
包含很多知名算法实现,支持向量机,决策树,粗糙集,贝叶斯分类器等,适合学术研究,短评论意见挖掘,文本分类等。
- 2022-06-03 05:40:28下载
- 积分:1
-
Java实现Apriori数据挖掘算法
Java实现Apriori数据挖掘算法,包内还有实例用的数据库
Apriori数据挖掘算法:先找出所有的频集,这些项集出现的频繁性至少和预定义的最小支持度一样。然后由频集产生强关联规则,这些规则必须满足最小支持度和最小可信度。然后使用第1步找到的频集产生期望的规则,产生只包含集合的项的所有规则,其中每一条规则的右部只有一项,这里采用的是中规则的定义。一旦这些规则被生成,那么只有那些大于用户给定的最小可信度的规则才被留下来。为了生成所有频集,使用了递归的方法。
请在jbuilder下编译 配好JDBC驱动
商品如果
买的表示为大写
没买表示为小写的
具体看GetSource.java
- 2022-10-02 14:05:03下载
- 积分:1
-
python 实现随机森林
应用背景
数据 :两个月之内 40000个客户的15个数据字段 包含客户的 地 理位置,职业,职级,年收入,。。。。。。 购买过得产品
目的:对新客户进行推荐一个适合该客户的产品, 对老客户推荐可能再购买的产品
数据处理
数据清洗: describe 每个特征统计分析 方差 -分析缺陷特征和波动性
空值赋值为 “-1 “ - 保证模型的可使用
数据归一化:eg:邮编 相似度不高 根据一线二线….进行划分 – 特征的重要性
关键技术特征选择
随机森林: 判断特征的重要性 :思考为何重要性高
AHP : 迭代设置每个特征的权重
模型选择 :根据数据量数量,是否有标签,分类or回归选取
关于模型选择时候我想用协同过滤 但是不知道关于特征的协同过滤是怎么执行的 是每个特征都有一个评分构成评价矩阵么?
- 2022-02-25 17:28:51下载
- 积分:1
-
频繁项集挖掘算法--FPGROWTH算法
数据挖掘经典算法,频繁项集挖掘经典算法,FPGROWTH算法,源码中有详细说明
- 2023-06-08 16:30:03下载
- 积分:1
-
频繁项集挖掘算法--TWOPHASE算法
数据挖掘经典算法,频繁项集挖掘经典算法,TWOPHASE算法,源码中有详细注释
- 2022-10-13 14:30:03下载
- 积分:1
-
高效用项集挖掘算法--HMINE算法
数据挖掘算法,高效用项集挖掘算法,加权频发项集挖掘算法,HMINE算法,源码中有详细注释
- 2022-02-04 07:22:38下载
- 积分:1
-
文本分类(采用Java语言)
资源描述利用分类算法实现对文本的数据挖掘,主要包括: 1. 语料库的构建,主要包括利用爬虫收集Web文档等; 2. 语料库的数据预处理,包括文档建模,如去噪,分词,建立数据字典, 使用词袋模型或主题模型表达文档等; 注:使用主题模型,如LDA可以获得实验加分; 3. 选择分类算法(如朴素贝叶斯、SVM等),训练文本分类器,理解所选 的分类算法的建模原理、实现过程和相关参数的含义; 4. 对测试集的文本进行分类 5. 对测试集的分类结果利用正确率和召回率进行分析评价。
- 2022-02-13 04:15:07下载
- 积分:1
-
微博数据挖掘
利用python调用新浪api接口实现的新浪微博数据的挖掘,能够获取指定的经纬度地点的微博动态信息,还能够将其写入MySQL数据库中。
- 2022-07-12 15:52:46下载
- 积分:1