-
向量元素进行排序
该程序应用于并行排序算法Betchera。该算法属于一组并行排序的,这些算法之间的主要区别是并行(同时)作用于分选的数字数据集的可能性。class MyParSort Classvoid Setup 请点击左侧文件开始预览 !预览只提供20%的代码片段,完整代码需下载后查看 加载中 侵权举报
- 2022-03-23 19:22:26下载
- 积分:1
-
利用CUDA平台计算矩阵乘法的GPU编程
本程序为简易的CUDA编程,两个程序都是计算矩阵的乘法。其中Matrix1和Matrix2的区别是Matrix2使用了shared memory。每个程序都使用了串行和并行两种方式计算乘法,最后将并行的运算结果与串行运算结果对比,验证计算的正确性。同时,程序中利用CUDA计时模块统计了并行运算的耗时。因此可以得出使用shared memory后改善的运行时间。
- 2022-12-18 17:50:03下载
- 积分:1
-
在 win32 中的多线程应用程序
在 win32 中的 Multithreadingapplications。C 编程在多线程环境中的 windows levelapplication 源代码。Multithreadin windows 系统很好的书。
- 2022-10-17 09:15:15下载
- 积分:1
-
视频游戏的流体模拟,第 5 部分
性能分析与优化
这篇文章,在一系列,第五描述的性能分析和优化的流体模拟,提出了一种在第三和第四条款中。第一篇文章总结了流体动力学 ;第二个调查流体仿真技术 ;和第三和第四次提出了一个旋涡粒子流体模拟与双向流体体之间的相互作用,它运行在真正的时间。这篇文章利用另一个功能的英特尔 ® 线程构建模块 (英特尔 ® TBB) 将更多的工作分散到多个线程。这篇文章描述 CPU 使用情况分析过程,并使用该信息来优化和进一步并行化的代码,使其运行得更快。
性能分析和优化本文中描述的过程中的许多镜子中所述的程序软件优化食谱。这一过程从开始创建基准 — — 一大块的代码用来量化正在优化算法的性能。其余的过程需要迭代上的三个步骤:
要找出所谓的"热点",应用程序在哪里花费其大部分时间的配置文件。
探讨为什么热点会消耗很多时间的详细信息。
修改,试图让它更快的代码。
将这些步骤应用于流体模拟应用程序在前两篇文章中提出了这条记载。
相关的文章
流体模拟视频游戏 (第1部分)
流体模拟视频游戏 (第 2 部分)
流体模拟视频游戏 (第 3 部分)
流体模拟视频游戏 (第 4 部分)
流体模拟视频游戏 (第 5 部分)
流体
- 2022-05-18 08:33:08下载
- 积分:1
-
多目标遗传算法优化
研究多目标遗传算法的优化,包含遗传算法过程中涉及的的各个步骤,非常适合于研究遗传算法及对遗传算法进行多目标优化的同学
- 2022-01-25 17:35:18下载
- 积分:1
-
GPU CUDA 的矩阵SOR
SOR(Successive Over-Relaxation) 又名逐次超松弛法,是解决微分方程的一种通用算法,主要应用在解决拉普拉斯方程、肥皂泡形状等的问题上。本程序使用CUDA来实现sor,并且包含两种方法,一种是单一block运算整个矩阵,每个thread运算矩阵中的一个方块。一种是多个block运算整个矩阵,每个thread运算矩阵中的一个点。该程序有良好的注释,适合初学者学习。
- 2022-09-25 08:50:03下载
- 积分:1
-
H.264编解码的CUDA实现,并行加速算法
H.264编解码的CUDA实现,并行加速算法,内部实现了H.264视频编解码的CUDA实现,能够编译通过,已经过测试,并且还添加了注释信息。
- 2022-03-25 09:18:02下载
- 积分:1
-
Hadoop的相关资料
能让大家更好的理解Hadoop Map Reduce的内容,并讲解如何安装hadoop,如何在Linux环境下配置Hadoop和ssh等,以及Hadoop等在大数据处理方面的应用。
- 2022-02-04 06:07:18下载
- 积分:1
-
I2C driver
I2C总线驱动,8位单片机适用。
在总线控制,并下发指令是,效率好,另外,此程序在keil编译器中已经编译通过。
- 2022-01-31 04:15:49下载
- 积分:1
-
VB视屏聊天
通过存储选中开始结束为止,确定颜色,仙剑一个文件夹,之后删除将恢复健康的和健康和vkjdfnkjkjn;k独守空房军看见电脑;来看看了呢空间能看见你空间呢控件看来今年 看你空间呢
- 2022-12-07 06:20:02下载
- 积分:1