登录
首页 » java,scala » spark-fpgrowth

spark-fpgrowth

于 2022-06-16 发布 文件大小:3.24 kB
0 126
下载积分: 2 下载次数: 1

代码说明:

Spark.mllib 提供并行FP-growth算法,这个算法属于关联规则算法【关联规则:两不相交的非空集合A、B,如果A=>B,就说A=>B是一条关联规则,常提及的{啤酒}-->{尿布}就是一条关联规则】,经常用于挖掘频度物品集。关于算法的介绍网上很多,这里不再赘述。主要搞清楚几个概念: 1)支持度support(A => B) = P(AnB) = |A n B| / |N|,表示数据集D中,事件A和事件B共同出现的概率; 2)置信度confidence(A => B) = P(B|A) = |A n B| / |A|,表示数据集D中,出现事件A的事件中出现事件B的概率; 3)提升度lift(A => B) = P(B|A):P(B) = |A n B| / |A| : |B| / |N|,表示数据集D中,出现A的条件下出现事件B的概率和没有条件A出现B的概率; 由上可以看出,支持度表示这条规则的可能性大小,而置信度表示由事件A得到事件B的可信性大小。 举个列子:10000个消费者购买了商品,尿布1000个,啤酒2000个,同时购买了尿布和啤酒800个。  1)

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论

0 个回复

  • spark-fpgrowth
    Spark.mllib 提供并行FP-growth算法,这个算法属于关联规则算法【关联规则:两不相交的非空集合A、B,如果A=>B,就说A=>B是一条关联规则,常提及的{啤酒}-->{尿布}就是一条关联规则】,经常用于挖掘频度物品集。关于算法的介绍网上很多,这里不再赘述。主要搞清楚几个概念: 1)支持度support(A => B) = P(AnB) = |A n B| / |N|,表示数据集D中,事件A和事件B共同出现的概率; 2)置信度confidence(A => B) = P(B|A) = |A n B| / |A|,表示数据集D中,出现事件A的事件中出现事件B的概率; 3)提升度lift(A => B) = P(B|A):P(B) = |A n B| / |A| : |B| / |N|,表示数据集D中,出现A的条件下出现事件B的概率和没有条件A出现B的概率; 由上可以看出,支持度表示这条规则的可能性大小,而置信度表示由事件A得到事件B的可信性大小。 举个列子:10000个消费者购买了商品,尿布1000个,啤酒2000个,同时购买了尿布和啤酒800个。  1)
    2022-06-16 09:01:41下载
    积分:1
  • 基于Spark的频繁项集挖掘算法并行化研究
     数据挖掘时处理现在发展迅速的大量数据的科学技术,数据库研发改进技术,人工智能学习领域都有所涉及 基于Spark的频繁项集挖掘算法并行化研究我们从最经典的apriori算法进行实现,java语言完成。
    2022-11-05 13:40:03下载
    积分:1
  • java 模板语言核心代码
    模板语言,java,股票,证券。非常棒的。功能强大 package com.honey.template.algorithm.formula; import java.util.ArrayList; import java.util.HashMap; import java.util.List; import java.util.Map; import com.honey.template.algorithm.formula.support.DataFieldValueContext; import com.honey.template.algorithm.formula.support.RelatedFieldContext; import com.honey.template.algorithm.formula.support.RelatedFieldInfo; import com.honey.template.algorithm.formula.support.VariableContext; import fr.expression4j.basic.MathematicalElement; import fr.expression4j.core.Expression; /**  * * @ClassName: Formula * @Description: TODO * @author duanl * @date 2016年6月13日 *  */ public class Formula {  private String v;  private String[] varnames;  private Map returns =
    2022-05-14 09:40:41下载
    积分:1
  • 用于构建分布式系统的http://orbit.bioware.com/轨道-虚拟角色框架
    公共接口你好延伸演员{任务;sayHello(字符串的问候);
    2022-12-31 22:35:04下载
    积分:1
  • mypipe
    数据库消息同步组件,根据读取binlog发送kafka消息,当数据发生变化时,可根据具体变化内容来通知业务作出相应的动作.
    2022-07-27 14:35:34下载
    积分:1
  • 696518资源总数
  • 104287会员总数
  • 49今日下载