-
java版kmeans算法以及mapreduces实现
java实现kmenas算法,有详细的注释,以及MapReduce实现Kmeans算法。
Map每读取一条数据就与聚类中心对比,求出该条记录对应的聚类中心,然后以聚类中心ID为key,该条数据为value将数据输出
利用Reduce的归并功能将相同的key(聚类中心ID相同)归并到一起,集中与该Key对应的数据,求出这些数据的平均值,输出平均值
对比Reduce求出的平均值与原来的聚类中心,如果不相同,将清空原中心的数据文件,将Reduce的结果写到中心文件中
- 2023-03-18 03:40:04下载
- 积分:1
-
HBase增删改查等相关操作
代码中利用Hbase相关的API,包括对HBase的增删改查等操作,对于初学者学习HBase能够起到作用。
前提是导入hadoop和hbase相关的jar包,可以在hadoop集群上面下载
- 2022-02-26 04:13:40下载
- 积分:1
-
hadoop hive
Hadoop构建数据仓库实践 操作指南 大数据知识(hadoop java hive bigdata)
- 2019-04-06 09:26:20下载
- 积分:1
-
图像文件转换为MapReduce可以读写的二进制文件代码
Hadoop的计算框架只能处理文本文件,对于图像数据不能直接处理,本代码可以实现将图像文件转换成Mapreduce可以读取的SequenceFile,其中包括单机写入和读取,以及mapreduce读取,是进行分布式处理图像数据的第一步。
- 2022-11-14 02:20:03下载
- 积分:1
-
CRS编码
用于hadoop0.22.0的分布式纠删编码,是对原始hadoop0.22.0的改进版本,大大提高数据恢复速度,非常高效。
- 2022-09-12 03:55:03下载
- 积分:1
-
基于MapReduce的大量数据求和
使用Hadoop中的MapReduce计算框架可以对数字文本分析及求和,当遇到大规模数据时,使用别的编程语言会使得计算过程变得复杂,但使用MapReduce并行计算框架只需编写map函数和reduce函数即可,简单方便。
- 2022-02-28 22:28:59下载
- 积分:1
-
mahout实战中k-means源码
mahout是一个开源的机器学习平台!mahout实战这本书详细的讲解了mahout的原理并且介绍了相应算法的实例。本文件包含了该书的相应实例的相应源码。
- 2022-03-11 02:22:22下载
- 积分:1
-
hahoop源码
hadoop 源代码
- 2022-03-23 13:20:51下载
- 积分:1
-
hiped2_sourcecode.zip
ont-style:normal;font-variant:normal;"突然之间, 大数据一下子就“火”了, 开源软件 Hadoop 也因此水涨船高 请点击左侧文件开始预览 !预览只提供20%的代码片段,完整代码需下载后查看 加载中 侵权举报
- 2022-05-26 04:34:14下载
- 积分:1
-
hadoopTest
1、WordCountMap类继承了org.apache.hadoop.mapreduce.Mapper,4个泛型类型分别是map函数输入key的类型,输入value的类型,输出key的类型,输出value的类型。
2、WordCountReduce类继承了org.apache.hadoop.mapreduce.Reducer,4个泛型类型含义与map类相同。
3、map的输出类型与reduce的输入类型相同,而一般情况下,map的输出类型与reduce的输出类型相同,因此,reduce的输入类型与输出类型相同。
4、hadoop根据以下代码确定输入内容的格式:
- 2022-11-11 11:35:03下载
- 积分:1