网站首页

登录

spark-fpgrowth

于 2022-06-16 发布文件大小:3.24 kB

 0  133

下载积分: 2 下载次数: 1

我要下载

代码说明：

Spark.mllib 提供并行FP-growth算法，这个算法属于关联规则算法【关联规则：两不相交的非空集合A、B，如果A=>B，就说A=>B是一条关联规则，常提及的{啤酒}-->{尿布}就是一条关联规则】，经常用于挖掘频度物品集。关于算法的介绍网上很多，这里不再赘述。主要搞清楚几个概念： 1)支持度support(A => B) = P(AnB) = |A n B| / |N|，表示数据集D中，事件A和事件B共同出现的概率； 2)置信度confidence(A => B) = P(B|A) = |A n B| / |A|，表示数据集D中，出现事件A的事件中出现事件B的概率； 3）提升度lift(A => B) = P(B|A):P(B) = |A n B| / |A| : |B| / |N|，表示数据集D中，出现A的条件下出现事件B的概率和没有条件A出现B的概率；由上可以看出，支持度表示这条规则的可能性大小，而置信度表示由事件A得到事件B的可信性大小。举个列子：10000个消费者购买了商品，尿布1000个，啤酒2000个，同时购买了尿布和啤酒800个。 1)

下载说明：请别用迅雷下载，失败请重下，重下不扣分！

发表评论

0 个回复

spark-fpgrowth
Spark.mllib 提供并行FP-growth算法，这个算法属于关联规则算法【关联规则：两不相交的非空集合A、B，如果A=>B，就说A=>B是一条关联规则，常提及的{啤酒}-->{尿布}就是一条关联规则】，经常用于挖掘频度物品集。关于算法的介绍网上很多，这里不再赘述。主要搞清楚几个概念： 1)支持度support(A => B) = P(AnB) = |A n B| / |N|，表示数据集D中，事件A和事件B共同出现的概率； 2)置信度confidence(A => B) = P(B|A) = |A n B| / |A|，表示数据集D中，出现事件A的事件中出现事件B的概率； 3）提升度lift(A => B) = P(B|A):P(B) = |A n B| / |A| : |B| / |N|，表示数据集D中，出现A的条件下出现事件B的概率和没有条件A出现B的概率；由上可以看出，支持度表示这条规则的可能性大小，而置信度表示由事件A得到事件B的可信性大小。举个列子：10000个消费者购买了商品，尿布1000个，啤酒2000个，同时购买了尿布和啤酒800个。 1)

2022-06-16 09:01:41下载

积分：1
mypipe
数据库消息同步组件,根据读取binlog发送kafka消息,当数据发生变化时,可根据具体变化内容来通知业务作出相应的动作.

2022-07-27 14:35:34下载

积分：1
java 模板语言核心代码
模板语言，java，股票，证券。非常棒的。功能强大 package com.honey.template.algorithm.formula; import java.util.ArrayList; import java.util.HashMap; import java.util.List; import java.util.Map; import com.honey.template.algorithm.formula.support.DataFieldValueContext; import com.honey.template.algorithm.formula.support.RelatedFieldContext; import com.honey.template.algorithm.formula.support.RelatedFieldInfo; import com.honey.template.algorithm.formula.support.VariableContext; import fr.expression4j.basic.MathematicalElement; import fr.expression4j.core.Expression; /** * * @ClassName: Formula * @Description: TODO * @author duanl * @date 2016年6月13日 * */ public class Formula { private String v; private String[] varnames; private Map returns =

2022-05-14 09:40:41下载

积分：1
用于构建分布式系统的http://orbit.bioware.com/轨道-虚拟角色框架
公共接口你好延伸演员{任务；sayHello（字符串的问候）；

2022-12-31 22:35:04下载

积分：1
基于Spark的频繁项集挖掘算法并行化研究
数据挖掘时处理现在发展迅速的大量数据的科学技术，数据库研发改进技术，人工智能学习领域都有所涉及基于Spark的频繁项集挖掘算法并行化研究我们从最经典的apriori算法进行实现，java语言完成。

2022-11-05 13:40:03下载

积分：1

696518资源总数
104386会员总数
20今日下载