-
python 实现随机森林
应用背景
数据 :两个月之内 40000个客户的15个数据字段 包含客户的 地 理位置,职业,职级,年收入,。。。。。。 购买过得产品
目的:对新客户进行推荐一个适合该客户的产品, 对老客户推荐可能再购买的产品
数据处理
数据清洗: describe 每个特征统计分析 方差 -分析缺陷特征和波动性
空值赋值为 “-1 “ - 保证模型的可使用
数据归一化:eg:邮编 相似度不高 根据一线二线….进行划分 – 特征的重要性
关键技术特征选择
随机森林: 判断特征的重要性 :思考为何重要性高
AHP : 迭代设置每个特征的权重
模型选择 :根据数据量数量,是否有标签,分类or回归选取
关于模型选择时候我想用协同过滤 但是不知道关于特征的协同过滤是怎么执行的 是每个特征都有一个评分构成评价矩阵么?
- 2022-02-25 17:28:51下载
- 积分:1
-
my_apriori
很好用的关联规则挖掘经典算法,推荐使用。包括支持度、置信度、提升度,输出结果到excel文件(Good use of association rules mining classic algorithm, recommended)
- 2018-11-14 15:51:16下载
- 积分:1
-
PLSR程序
说明: 偏最小二乘回归!PLSR,可用于解决一些回归问题!(Partial least squares regression! PLSR can be used to solve some regression problems!)
- 2019-11-29 20:42:27下载
- 积分:1
-
pu_ju_lei
说明: 将数据集转换为拉普拉斯矩阵,然后利用基于图论的谱聚类进行聚类。拉普拉斯矩阵采用高斯核函数,全连接方法计算。谱聚类擅长处理高维数据或非凸数据集。(The data set is transformed into Laplacian matrix, and then clustered by spectral clustering based on graph theory. The Laplacian matrix is calculated by using the Gauss kernel function and the full connection method. Spectral clustering is good at dealing with high-dimensional or non-convex data sets.)
- 2019-07-01 16:05:39下载
- 积分:1
-
Eigenfunction-Program-Program
强大的计算电磁场本征函数与本征模的程序,matlab版本(A powerful Program for calculating the Eigenfunction and Eigenmode of electromagnetic Field)
- 2018-09-11 22:56:16下载
- 积分:1
-
频繁项集挖掘算法--TWOPHASE算法
数据挖掘经典算法,频繁项集挖掘经典算法,TWOPHASE算法,源码中有详细注释
- 2022-10-13 14:30:03下载
- 积分:1
-
煤炭价格多元时序预测
说明: 内附源数据、代码及word。代码包括:平稳性检验、协整检验、滞后阶数的确定、VAR 模型的拟合、脉冲响应分析、VAR 模型的预测(Stationarity test, co integration test, determination of lag order, VAR model fitting, impulse response analysis, VAR model prediction)
- 2021-03-30 19:09:09下载
- 积分:1
-
Ecalt算法
Eclat算法是一种深度优先算法,采用垂直数据表示形式,在概念格理论的基础上利用基于前缀的等价关系将搜索空间(概念格)划分为较小的子空间(子概念格)。Eclat算法采用方法二计算支持度。对候选k项集进行支持度计算时,不需再次扫描数据库,仅在一次扫描数据库后得到每个1项集的支持度,而候选k项集的支持度就是在对k-1项集进行交集操作后得到的该k项集Tidset中元素的个数。本算法利用diffset数据格式实现。
- 2022-03-02 17:06:13下载
- 积分:1
-
聚类指标小结
聚类评价指标的各种说明,非常详细,请仔细阅读。(Cluster evaluation indicators of various descriptions, very detailed.)
- 2020-06-19 05:20:01下载
- 积分:1
-
频繁子图挖掘算法pafi1.0.1.zip
频繁子图挖掘算法pafi1.0.1.zip,频繁子图挖掘算法采用c++实现,图数据挖掘方向的可以看一看。
- 2022-01-21 02:32:05下载
- 积分:1