-
视频游戏的流体模拟,第 5 部分
性能分析与优化
这篇文章,在一系列,第五描述的性能分析和优化的流体模拟,提出了一种在第三和第四条款中。第一篇文章总结了流体动力学 ;第二个调查流体仿真技术 ;和第三和第四次提出了一个旋涡粒子流体模拟与双向流体体之间的相互作用,它运行在真正的时间。这篇文章利用另一个功能的英特尔 ® 线程构建模块 (英特尔 ® TBB) 将更多的工作分散到多个线程。这篇文章描述 CPU 使用情况分析过程,并使用该信息来优化和进一步并行化的代码,使其运行得更快。
性能分析和优化本文中描述的过程中的许多镜子中所述的程序软件优化食谱。这一过程从开始创建基准 — — 一大块的代码用来量化正在优化算法的性能。其余的过程需要迭代上的三个步骤:
要找出所谓的"热点",应用程序在哪里花费其大部分时间的配置文件。
探讨为什么热点会消耗很多时间的详细信息。
修改,试图让它更快的代码。
将这些步骤应用于流体模拟应用程序在前两篇文章中提出了这条记载。
相关的文章
流体模拟视频游戏 (第1部分)
流体模拟视频游戏 (第 2 部分)
流体模拟视频游戏 (第 3 部分)
流体模拟视频游戏 (第 4 部分)
流体模拟视频游戏 (第 5 部分)
流体
- 2022-05-18 08:33:08下载
- 积分:1
-
secuential归并排序
secuential归并排序
- 2022-05-09 00:14:19下载
- 积分:1
-
Hadoop 排序实现
Hadoop环境下一个简单的排序算法实现,测试数据集可以选用任何数字形式的text文本文件,包含源代码及利用ant进行jar包压缩的build.xml文件,希望对大家学习Hadoop有用处。
- 2023-08-13 20:45:04下载
- 积分:1
-
implementation of the multiplication of two double matrices by using MATLAB C-Mex and CUBLAS library
本文介绍了一个通过GPU CUDA实现两个双矩阵相乘的MATLAB运算包。
- 2022-07-17 00:43:28下载
- 积分:1
-
并行程序设计_三角函数并行化程序设计
1) 熟练掌握并行程序设计的基本方法;
2) 通过实验,了解并行程序设计的过程以及优越性;
3) 学会并行程序的算法分析;
4) 结合高等工程数学、分布式系统、云计算等相关课程知识解决简单的实际问题。
- 2022-03-01 04:29:27下载
- 积分:1
-
metis-3.0 partitioning unstructured graphs, partitioning meshes, and computing fill-reducing order
Copyright 1997, Regents of the University of Minnesota.
METIS was written by George Karypis (karypis@cs.umn.edu)
Introduction ------------------------------------------------------------
METIS is a software package for partitioning unstructured graphs, partitioning
meshes, and computing fill-reducing orderings of sparse matrices.
The documentation of METIS can be found in the Doc/manual.ps file.
METIS is written in ANSI C and should compile on Unix systems that have
a ANSI C compiler. It has been extensively tested on the following
architectures:
AIX
SunOS
Solaris
IRIX
Unicos
Linux
HP-UX
FreeBSD
- 2022-02-20 19:44:54下载
- 积分:1
-
利用CUDA平台计算矩阵乘法的GPU编程
本程序为简易的CUDA编程,两个程序都是计算矩阵的乘法。其中Matrix1和Matrix2的区别是Matrix2使用了shared memory。每个程序都使用了串行和并行两种方式计算乘法,最后将并行的运算结果与串行运算结果对比,验证计算的正确性。同时,程序中利用CUDA计时模块统计了并行运算的耗时。因此可以得出使用shared memory后改善的运行时间。
- 2022-12-18 17:50:03下载
- 积分:1
-
OpenCl基础构架代码
应用背景密码暴力计算,大型数据计算都会用到,并行计算,本例程为通用openCL并行计算,基于nvidia平台下,例程综合了openCL的常用函数,平台创建、设备选择、内存分配、任务队列、核函数生成,可用本文件代码作为运行基础构架模板。关键技术
OpenCL常用函数构成的技术构架,可以在本代码基础之上适当修改,既可以应用于其他场合,免去繁杂的,重复配置函数的调用,本例程具有自动检测运行平台,运行设备。
- 2023-03-17 03:20:04下载
- 积分:1
-
H.264编解码的CUDA实现,并行加速算法
H.264编解码的CUDA实现,并行加速算法,内部实现了H.264视频编解码的CUDA实现,能够编译通过,已经过测试,并且还添加了注释信息。
- 2022-03-25 09:18:02下载
- 积分:1
-
美国把阿富汗的齿轮,激怒阿富汗人谁可以使用设备
- 2022-06-01 22:02:54下载
- 积分:1