-
朴素贝叶斯分类
朴素贝叶斯分类的分类器实现,使用的是matlab语言。内含测试集和训练集,可直接运行,readme.txt文件中说明了数据格式
- 2022-02-07 02:48:39下载
- 积分:1
-
频繁子图挖掘算法pafi1.0.1.zip
频繁子图挖掘算法pafi1.0.1.zip,频繁子图挖掘算法采用c++实现,图数据挖掘方向的可以看一看。
- 2022-01-21 02:32:05下载
- 积分:1
-
微博数据挖掘
利用python调用新浪api接口实现的新浪微博数据的挖掘,能够获取指定的经纬度地点的微博动态信息,还能够将其写入MySQL数据库中。
- 2022-07-12 15:52:46下载
- 积分:1
-
频繁项集挖掘算法
频繁项集挖掘算法,能在大量局部特征中发现频繁空间配置,这些空间配置可以作为词语,加入到特征包中进行分类,实现图像分类。
- 2022-03-23 21:38:47下载
- 积分:1
-
带阻尼参数的pagerank实现
资源描述实现基本的pagerank算法,可实现传递阻尼参数和迭代次数。源文件从文件中读取
- 2022-09-10 21:45:04下载
- 积分:1
-
数据挖掘中编写C语言程序数据预处理,读取文本文件中的数据,使用链表,并输出该组数据的按平均值、中值、边界值平滑的结果。若分箱时数据缺失则用最后的值复制代替,还要找出程序中
数据挖掘中编写C语言程序数据预处理,读取文本文件中的数据,使用链表,并输出该组数据的按平均值、中值、边界值平滑的结果。若分箱时数据缺失则用最后的值复制代替,还要找出程序中的离群点,要求程序符合结构化程序设计风格,关键地方需加注释。完美实现!
- 2022-02-28 20:00:10下载
- 积分:1
-
频繁项集挖掘算法--TWOPHASE算法
数据挖掘经典算法,频繁项集挖掘经典算法,TWOPHASE算法,源码中有详细注释
- 2022-10-13 14:30:03下载
- 积分:1
-
python 实现随机森林
应用背景
数据 :两个月之内 40000个客户的15个数据字段 包含客户的 地 理位置,职业,职级,年收入,。。。。。。 购买过得产品
目的:对新客户进行推荐一个适合该客户的产品, 对老客户推荐可能再购买的产品
数据处理
数据清洗: describe 每个特征统计分析 方差 -分析缺陷特征和波动性
空值赋值为 “-1 “ - 保证模型的可使用
数据归一化:eg:邮编 相似度不高 根据一线二线….进行划分 – 特征的重要性
关键技术特征选择
随机森林: 判断特征的重要性 :思考为何重要性高
AHP : 迭代设置每个特征的权重
模型选择 :根据数据量数量,是否有标签,分类or回归选取
关于模型选择时候我想用协同过滤 但是不知道关于特征的协同过滤是怎么执行的 是每个特征都有一个评分构成评价矩阵么?
- 2022-02-25 17:28:51下载
- 积分:1
-
频繁项集挖掘算法--CFPGROWTH算法
数据挖掘经典算法,频繁项集挖掘经典算法,CFPGROWTH算法,JAVA实现,代码中有详细注释
- 2023-03-29 10:25:03下载
- 积分:1
-
频繁项集挖掘算法--FPGROWTH算法
数据挖掘经典算法,频繁项集挖掘经典算法,FPGROWTH算法,源码中有详细说明
- 2023-06-08 16:30:03下载
- 积分:1