-
基于Hadoop的文本分类(1)-文本预处理&文本表示
资源描述一、环境环境:Ubuntu14、Hadoop2.6,Eclipse、NLPIR/ICTCLAS2015等;
二、算法简介:
1、此项目是基于Hadoop2.6进行MapReduce并行开发;
2、此项目是文本分类的文本预处理和文本表示部分,包括分词,去停用词,特征选择和文本表示等(分类算法采用的是随机森林算法,暂时未开放,读者可自行采用Mahout或Weka进行验证);
3、分词采用的是NLPIR/ICTCLAS2015;文本表示采用的是VSM模型,权重计算采用TFIDF进行文本表示;特征选择采用CHI算法(卡方统计);
4、关于并行分词环境搭建,可参考我的博客http://www.cnblogs.com/merru/p/4917665.html
5、关于Hadoop环境搭建,可参考我的博客http://www.cnblogs.com/merru/p/4901528.html和http://www.cnblogs.com/merru/p/4905118.html。
- 2022-03-01 12:43:10下载
- 积分:1
-
OpenCl基础构架代码
应用背景密码暴力计算,大型数据计算都会用到,并行计算,本例程为通用openCL并行计算,基于nvidia平台下,例程综合了openCL的常用函数,平台创建、设备选择、内存分配、任务队列、核函数生成,可用本文件代码作为运行基础构架模板。关键技术
OpenCL常用函数构成的技术构架,可以在本代码基础之上适当修改,既可以应用于其他场合,免去繁杂的,重复配置函数的调用,本例程具有自动检测运行平台,运行设备。
- 2023-03-17 03:20:04下载
- 积分:1
-
视频游戏的流体模拟,第 3 部分
涡粒子流体模拟
这篇文章,第三个在一系列,介绍了在 c + + 中使用谦虚,通常可用计算机硬件实时运行中实现流体模拟。第一篇文章总结了流体动力学 ;第二个调查流体模拟技术。
仿真这里介绍用途涡粒子,称为vortons由诺维科夫 (1983),来代表的流场和每一次的速度解决了。这种战术的使用 vortons 保留涡度无明显来源的扩散,可以模拟保留细鳞的详细信息。相比之下,其他流体模拟技术,使用原始变量 (速度和压力) 或网格数值弥漫性涡度,所以流动往往看起来厚和糖浆。当你看到这种模拟的结果时,你会惊讶于它保留了,多少议案详细考虑它跑得多快。
这种模拟也利用令人尴尬的并行算法的性质,并使用英特尔 ® 线程构建模块(英特尔 ® TBB) 跨越多个线程的工作。
在努力实现实时的流体运动,一些其他流体模拟利用图形处理单元 (GPGPU) 通用计算。
- 2022-04-29 19:04:05下载
- 积分:1
-
美国把阿富汗的齿轮,激怒阿富汗人谁可以使用设备
- 2022-06-01 22:02:54下载
- 积分:1
-
细胞生命的模拟化
This application provides an implementation of Conway’s Game of Life, using the Parallel class to parallelize the processing of the cellular automata.
- 2022-06-29 16:39:03下载
- 积分:1
-
读取参数文件
#include
#define NUMBER 4
void main( )
{ int i=1;
float f0,dt,dx,dz;
int mx,mz,ntmax,pml,sou_x,sou_z,rec_start,rec_end,rec_int,rec_depth;
char shotID[5],record_pp[30],vp_name[30],rou_name[30],mig_name[30],mig_pyt_name[30],mig_udlf_name[40],shuoming[30];
FILE *fp,*f; /*&不合法变量*/
printf("** This program is to show the block file input & output**
");
fp=fopen(
- 2022-09-05 20:35:03下载
- 积分:1
-
并行使用 C# 的变身算法
--概述:
变形两个图像的位图或影片剪辑的序列作为输出结果。
硬件要求:
此示例需要 DirectX 11 能够卡,如果没有检测到示例将使用 DirectX 11 参考模拟器。
-软件要求:
从 http://msdn.microsoft.com 安装 Visual Studio 2012
- 2022-03-09 17:49:47下载
- 积分:1
-
mapreduce下矩阵相乘——内积方法
左矩阵A是m×s,右矩阵B是s×n,结果矩阵C是m×n。
- 2023-01-06 10:40:03下载
- 积分:1
-
基于在线云保障食品安全
时下人们已成为热心研究人员对全球各地的几个类型食物食谱。他们登录到几个网站,以获取最喜爱的美食和样式。除了中国、 泰国和意大利,印度食品在其 cusines 中有广泛的品种。印度食品是太辣和油性为旅游来自西方国家,其中许多研究结束其营养价值。在这里,我们建议提供的各种各样的中印度已消费的食品营养价值的 web 应用程序。拟议的系统将提供原料蔬菜、 奶制品、 烹饪那些被消耗在这个国家的产品的营养价值。这一制度的目的是向意识到人民从过度消费的是不适合他们的荒地和心灵的食物食谱。
- 2022-02-01 14:45:01下载
- 积分:1
-
MFC调用CUDA
如何在MFC中调用CUDA
环境: Windows Vista SP1
Microsoft Visual Studio 2005
CUDA 2.0
步骤:
1. 创建一个对话框的
- 2023-04-01 09:30:04下载
- 积分:1