登录
首页 » 并行计算 » 利用CUDA平台计算矩阵乘法的GPU编程

利用CUDA平台计算矩阵乘法的GPU编程

于 2022-12-18 发布 文件大小:3.42 kB
0 142
下载积分: 2 下载次数: 1

代码说明:

本程序为简易的CUDA编程,两个程序都是计算矩阵的乘法。其中Matrix1和Matrix2的区别是Matrix2使用了shared memory。每个程序都使用了串行和并行两种方式计算乘法,最后将并行的运算结果与串行运算结果对比,验证计算的正确性。同时,程序中利用CUDA计时模块统计了并行运算的耗时。因此可以得出使用shared memory后改善的运行时间。

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论

0 个回复

  • 基于在线云保障食品安全
    时下人们已成为热心研究人员对全球各地的几个类型食物食谱。他们登录到几个网站,以获取最喜爱的美食和样式。除了中国、 泰国和意大利,印度食品在其 cusines 中有广泛的品种。印度食品是太辣和油性为旅游来自西方国家,其中许多研究结束其营养价值。在这里,我们建议提供的各种各样的中印度已消费的食品营养价值的 web 应用程序。拟议的系统将提供原料蔬菜、 奶制品、 烹饪那些被消耗在这个国家的产品的营养价值。这一制度的目的是向意识到人民从过度消费的是不适合他们的荒地和心灵的食物食谱。
    2022-02-01 14:45:01下载
    积分:1
  • OpenMP的例子
    openmp,并行计算是提高代码效率的非常有用的处理方法; 这是一个全面的openmp的使用例子;可以从类似编译条件的方式使用MP, 学习OPENMP让,程序飞起来!
    2022-04-08 19:24:46下载
    积分:1
  • HADOOP3使用开发教程
    hadoop是apache的开源项目,开发的主要目的是为了构建可靠,可拓展scalable,分布式的系统,hadoop是一系列的子工程的总和,其中包含。 1. hadoop common:为其他项目提供基础设施 2. HDFS:分布式的文件系统 请点击左侧文件开始预览 !预览只提供20%的代码片段,完整代码需下载后查看 加载中 侵权举报
    2022-09-26 15:25:03下载
    积分:1
  • MFC调用CUDA
    如何在MFC中调用CUDA 环境:     Windows Vista SP1 Microsoft Visual Studio 2005 CUDA 2.0 步骤: 1.       创建一个对话框的
    2023-04-01 09:30:04下载
    积分:1
  • implementation of the multiplication of two double matrices by using MATLAB C-Mex and CUBLAS library
    本文介绍了一个通过GPU CUDA实现两个双矩阵相乘的MATLAB运算包。
    2022-07-17 00:43:28下载
    积分:1
  • 视频游戏的流体模拟,第 6 部分
    差动速度算法器 这篇文章,在一系列,第六描述从根本上不同的方法计算速度从涡度,提出了在这些文章中的流体模拟的基石之一。第一篇文章总结了流体动力学 ;第二个调查流体仿真技术 ;和第三和第四次提出了涡粒子流体模拟与双向流体体之间的相互作用,在真正的时间运行。第五篇文章展示了如何获取和使用 CPU 使用率分析数据,优化,进一步并行化的代码,这样,它跑得更快。 这篇文章介绍一种求解速度从涡度的微分技术和与第 3 部分中所提出的积分 treecode 技术及其成果和业绩形成鲜明对比。泊松规划求解在这篇文章提出了一种比跑得快 treecode,但它的结果看起来不同的可能不那么令人满意。 涡旋速度,回顾 记得第二篇文章,您可以计算速度从涡度 请点击左侧文件开始预览 !预览只提供20%的代码片段,完整代码需下载后查看 加载中 侵权举报
    2022-02-05 03:15:32下载
    积分:1
  • PLINQ is Coming Up Soon (PFX)
    介绍
    2022-10-06 18:20:02下载
    积分:1
  • 基于Hadoop的文本分类(1)-文本预处理&文本表示
    资源描述一、环境环境:Ubuntu14、Hadoop2.6,Eclipse、NLPIR/ICTCLAS2015等; 二、算法简介: 1、此项目是基于Hadoop2.6进行MapReduce并行开发; 2、此项目是文本分类的文本预处理和文本表示部分,包括分词,去停用词,特征选择和文本表示等(分类算法采用的是随机森林算法,暂时未开放,读者可自行采用Mahout或Weka进行验证); 3、分词采用的是NLPIR/ICTCLAS2015;文本表示采用的是VSM模型,权重计算采用TFIDF进行文本表示;特征选择采用CHI算法(卡方统计); 4、关于并行分词环境搭建,可参考我的博客http://www.cnblogs.com/merru/p/4917665.html 5、关于Hadoop环境搭建,可参考我的博客http://www.cnblogs.com/merru/p/4901528.html和http://www.cnblogs.com/merru/p/4905118.html。
    2022-03-01 12:43:10下载
    积分:1
  • 视频游戏的流体模拟,第 3 部分
    涡粒子流体模拟 这篇文章,第三个在一系列,介绍了在 c + + 中使用谦虚,通常可用计算机硬件实时运行中实现流体模拟。第一篇文章总结了流体动力学 ;第二个调查流体模拟技术。 仿真这里介绍用途涡粒子,称为vortons由诺维科夫 (1983),来代表的流场和每一次的速度解决了。这种战术的使用 vortons 保留涡度无明显来源的扩散,可以模拟保留细鳞的详细信息。相比之下,其他流体模拟技术,使用原始变量 (速度和压力) 或网格数值弥漫性涡度,所以流动往往看起来厚和糖浆。当你看到这种模拟的结果时,你会惊讶于它保留了,多少议案详细考虑它跑得多快。 这种模拟也利用令人尴尬的并行算法的性质,并使用英特尔 ® 线程构建模块(英特尔 ® TBB) 跨越多个线程的工作。 在努力实现实时的流体运动,一些其他流体模拟利用图形处理单元 (GPGPU) 通用计算。
    2022-04-29 19:04:05下载
    积分:1
  • JAVA多线程折半插入排序的
    应用背景并行计算是最近新兴的一门技术,但是关于并行计算的代码在现在还不是特别普遍。本文是关于折半插入排序的并行计算的应用,希望对您的学习有一定的帮助。关键技术并行计算,多线程,折半插入排序,加速比,并行,串行
    2022-07-09 13:30:02下载
    积分:1
  • 696518资源总数
  • 104349会员总数
  • 32今日下载