登录
首页 » 数据挖掘 » python 实现随机森林

python 实现随机森林

于 2022-02-25 发布 文件大小:3.24 kB
0 184
下载积分: 2 下载次数: 2

代码说明:

应用背景 数据   :两个月之内 40000个客户的15个数据字段   包含客户的 地          理位置,职业,职级,年收入,。。。。。。    购买过得产品 目的:对新客户进行推荐一个适合该客户的产品, 对老客户推荐可能再购买的产品 数据处理    数据清洗:   describe 每个特征统计分析       方差     -分析缺陷特征和波动性                 空值赋值为  “-1 “              -  保证模型的可使用    数据归一化:eg:邮编 相似度不高 根据一线二线….进行划分  – 特征的重要性 关键技术特征选择    随机森林:  判断特征的重要性 :思考为何重要性高     AHP    :  迭代设置每个特征的权重 模型选择   :根据数据量数量,是否有标签,分类or回归选取 关于模型选择时候我想用协同过滤  但是不知道关于特征的协同过滤是怎么执行的   是每个特征都有一个评分构成评价矩阵么?

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论

0 个回复

  • 频繁子图算法pafi1.0.1.zip
    频繁子图挖掘算法pafi1.0.1.zip,频繁子图挖掘算法采用c++实现,图数据挖掘方向的可以看一看。
    2022-01-21 02:32:05下载
    积分:1
  • 频繁项集算法--TWOPHASE算法
    数据挖掘经典算法,频繁项集挖掘经典算法,TWOPHASE算法,源码中有详细注释
    2022-10-13 14:30:03下载
    积分:1
  • python 实现随机森林
    应用背景 数据   :两个月之内 40000个客户的15个数据字段   包含客户的 地          理位置,职业,职级,年收入,。。。。。。    购买过得产品 目的:对新客户进行推荐一个适合该客户的产品, 对老客户推荐可能再购买的产品 数据处理    数据清洗:   describe 每个特征统计分析       方差     -分析缺陷特征和波动性                 空值赋值为  “-1 “              -  保证模型的可使用    数据归一化:eg:邮编 相似度不高 根据一线二线….进行划分  – 特征的重要性 关键技术特征选择    随机森林:  判断特征的重要性 :思考为何重要性高     AHP    :  迭代设置每个特征的权重 模型选择   :根据数据量数量,是否有标签,分类or回归选取 关于模型选择时候我想用协同过滤  但是不知道关于特征的协同过滤是怎么执行的   是每个特征都有一个评分构成评价矩阵么?
    2022-02-25 17:28:51下载
    积分:1
  • Java实现Apriori算法
    Java实现Apriori数据挖掘算法,包内还有实例用的数据库 Apriori数据挖掘算法:先找出所有的频集,这些项集出现的频繁性至少和预定义的最小支持度一样。然后由频集产生强关联规则,这些规则必须满足最小支持度和最小可信度。然后使用第1步找到的频集产生期望的规则,产生只包含集合的项的所有规则,其中每一条规则的右部只有一项,这里采用的是中规则的定义。一旦这些规则被生成,那么只有那些大于用户给定的最小可信度的规则才被留下来。为了生成所有频集,使用了递归的方法。 请在jbuilder下编译 配好JDBC驱动 商品如果 买的表示为大写 没买表示为小写的 具体看GetSource.java
    2022-10-02 14:05:03下载
    积分:1
  • 关于大的相关论文
    关于大数据的论文,对稀疏表示分类有很大的帮助,希望对初学者哟帮助
    2022-02-06 00:21:30下载
    积分:1
  • 中编写C语言程序预处理,读取文本文件中的,使用链表,并输出该组的按平均值、中值、边界值平滑的结果。若分箱时缺失则用最后的值复制代替,还要找出程序中
    数据挖掘中编写C语言程序数据预处理,读取文本文件中的数据,使用链表,并输出该组数据的按平均值、中值、边界值平滑的结果。若分箱时数据缺失则用最后的值复制代替,还要找出程序中的离群点,要求程序符合结构化程序设计风格,关键地方需加注释。完美实现!
    2022-02-28 20:00:10下载
    积分:1
  • 高效用项集算法--HMINE算法
    数据挖掘算法,高效用项集挖掘算法,加权频发项集挖掘算法,HMINE算法,源码中有详细注释
    2022-02-04 07:22:38下载
    积分:1
  • weka源代码
    weka是一个很优秀的数据挖掘软件,可以把weka作为程序包打入工程中,基本想要的功能很快就能实现
    2023-06-01 10:00:04下载
    积分:1
  • 高效用项集算法--HUIMINER算法
    数据挖掘算法,高效用项集挖掘算法,加权频繁项集挖掘,HUIMINER算法,源码中有详细注释
    2023-02-10 05:45:03下载
    积分:1
  • 频繁项集算法
    频繁项集挖掘算法,能在大量局部特征中发现频繁空间配置,这些空间配置可以作为词语,加入到特征包中进行分类,实现图像分类。
    2022-03-23 21:38:47下载
    积分:1
  • 696518资源总数
  • 104269会员总数
  • 31今日下载