python 实现随机森林
代码说明:
应用背景 数据 :两个月之内 40000个客户的15个数据字段 包含客户的 地 理位置,职业,职级,年收入,。。。。。。 购买过得产品 目的:对新客户进行推荐一个适合该客户的产品, 对老客户推荐可能再购买的产品 数据处理 数据清洗: describe 每个特征统计分析 方差 -分析缺陷特征和波动性 空值赋值为 “-1 “ - 保证模型的可使用 数据归一化:eg:邮编 相似度不高 根据一线二线….进行划分 – 特征的重要性 关键技术特征选择 随机森林: 判断特征的重要性 :思考为何重要性高 AHP : 迭代设置每个特征的权重 模型选择 :根据数据量数量,是否有标签,分类or回归选取 关于模型选择时候我想用协同过滤 但是不知道关于特征的协同过滤是怎么执行的 是每个特征都有一个评分构成评价矩阵么?
下载说明:请别用迅雷下载,失败请重下,重下不扣分!


