网站首页

登录

基于Hadoop的文本分类（1）-文本预处理&文本表示

于 2022-03-01 发布文件大小:10.67 MB

 0  231

下载积分: 2 下载次数: 1

我要下载

代码说明：

资源描述一、环境环境：Ubuntu14、Hadoop2.6，Eclipse、NLPIR/ICTCLAS2015等；二、算法简介： 1、此项目是基于Hadoop2.6进行MapReduce并行开发； 2、此项目是文本分类的文本预处理和文本表示部分，包括分词，去停用词，特征选择和文本表示等（分类算法采用的是随机森林算法，暂时未开放，读者可自行采用Mahout或Weka进行验证）； 3、分词采用的是NLPIR/ICTCLAS2015；文本表示采用的是VSM模型，权重计算采用TFIDF进行文本表示；特征选择采用CHI算法（卡方统计）； 4、关于并行分词环境搭建，可参考我的博客http://www.cnblogs.com/merru/p/4917665.html 5、关于Hadoop环境搭建，可参考我的博客http://www.cnblogs.com/merru/p/4901528.html和http://www.cnblogs.com/merru/p/4905118.html。

下载说明：请别用迅雷下载，失败请重下，重下不扣分！

发表评论

0 个回复

HADOOP3使用开发教程
hadoop是apache的开源项目，开发的主要目的是为了构建可靠，可拓展scalable，分布式的系统，hadoop是一系列的子工程的总和，其中包含。 1. hadoop common：为其他项目提供基础设施 2. HDFS：分布式的文件系统请点击左侧文件开始预览！预览只提供20%的代码片段，完整代码需下载后查看加载中侵权举报

2022-09-26 15:25:03下载

积分：1
H.264编解码的CUDA实现，并行加速算法
H.264编解码的CUDA实现，并行加速算法，内部实现了H.264视频编解码的CUDA实现，能够编译通过，已经过测试，并且还添加了注释信息。

2022-03-25 09:18:02下载

积分：1
cuda实现矩阵求逆
此程序包的矩阵求逆函数基于 CUDA 的实现包含对称的积极明确逆矩阵使用 GPU。用法，请参阅 testspd.cpp 中的示例。此外，一般块矩阵求逆通过高斯(pivotting) 没有消除。请参阅 testge.cpp 例如使用。注： GE 可能无法在单精度足够稳定。请参阅生成文件更改为双精度。

2022-07-16 13:09:40下载

积分：1
cuda语言实现向量相加
本程序是cuda语言实现向量相加的例子，通过这个例子可以学习cuda的基本语法格式，

2023-07-27 23:25:04下载

积分：1
Blend Images
A demo of very simple image manipulation using a Parallel.For loop. The application allows the user to load up two images and blends them together into a single, new image.

2022-07-27 17:53:54下载

积分：1
数据结构实验
多种算法实现链表的排序，可以更具需要进行适当该表计算哦，是基础了，欢迎同在学习的伙伴一起努力哦~ 数据结构实验

2022-11-12 13:15:04下载

积分：1
任务调度
这是一份具有异构多核计算环境下的任务调度，计算异构环境下的最小makespan，适合研究并行计算的同学学习

2022-02-06 06:14:35下载

积分：1
并行分布实现矩阵乘法
资源描述基于集群，测试后可用。实现了并行分布式求解矩阵的幂。基于消息传递的机制。主进程负责分配任务。各个子进程复杂计算。通过分块，有效的解决了内存不足的问题。

2023-07-19 07:35:03下载

积分：1
求矩阵特征值的并行算法的实现
QR算法是目前最广泛被用于求一般矩阵特征值的方法，但是由于串行算法的时间过于长，大大的降低了工作效率，所以我们将其在基于cuda架构上对其进行GPU加速，将原有的求矩阵特征值得串行算法进行并行化，大大地提高了工作效率

2022-11-06 08:40:04下载

积分：1
avr2323 my test c emulador
avr test fast pdp emulador kokoko dehght fh fg hd fgdf fdgdf bf bdtnjrtb bsdfb fvtbrtn fd dvrv vdr bdt f yngfnhgnrtn trnrtn rtntrn

2022-02-04 03:35:22下载

积分：1

696518资源总数
106235会员总数
12今日下载