-
视频游戏的流体模拟,第 5 部分
性能分析与优化
这篇文章,在一系列,第五描述的性能分析和优化的流体模拟,提出了一种在第三和第四条款中。第一篇文章总结了流体动力学 ;第二个调查流体仿真技术 ;和第三和第四次提出了一个旋涡粒子流体模拟与双向流体体之间的相互作用,它运行在真正的时间。这篇文章利用另一个功能的英特尔 ® 线程构建模块 (英特尔 ® TBB) 将更多的工作分散到多个线程。这篇文章描述 CPU 使用情况分析过程,并使用该信息来优化和进一步并行化的代码,使其运行得更快。
性能分析和优化本文中描述的过程中的许多镜子中所述的程序软件优化食谱。这一过程从开始创建基准 — — 一大块的代码用来量化正在优化算法的性能。其余的过程需要迭代上的三个步骤:
要找出所谓的"热点",应用程序在哪里花费其大部分时间的配置文件。
探讨为什么热点会消耗很多时间的详细信息。
修改,试图让它更快的代码。
将这些步骤应用于流体模拟应用程序在前两篇文章中提出了这条记载。
相关的文章
流体模拟视频游戏 (第1部分)
流体模拟视频游戏 (第 2 部分)
流体模拟视频游戏 (第 3 部分)
流体模拟视频游戏 (第 4 部分)
流体模拟视频游戏 (第 5 部分)
流体
- 2022-05-18 08:33:08下载
- 积分:1
-
多目标遗传算法优化
研究多目标遗传算法的优化,包含遗传算法过程中涉及的的各个步骤,非常适合于研究遗传算法及对遗传算法进行多目标优化的同学
- 2022-01-25 17:35:18下载
- 积分:1
-
metis-3.0 partitioning unstructured graphs, partitioning meshes, and computing fill-reducing order
Copyright 1997, Regents of the University of Minnesota.
METIS was written by George Karypis (karypis@cs.umn.edu)
Introduction ------------------------------------------------------------
METIS is a software package for partitioning unstructured graphs, partitioning
meshes, and computing fill-reducing orderings of sparse matrices.
The documentation of METIS can be found in the Doc/manual.ps file.
METIS is written in ANSI C and should compile on Unix systems that have
a ANSI C compiler. It has been extensively tested on the following
architectures:
AIX
SunOS
Solaris
IRIX
Unicos
Linux
HP-UX
FreeBSD
- 2022-02-20 19:44:54下载
- 积分:1
-
I2C driver
I2C总线驱动,8位单片机适用。
在总线控制,并下发指令是,效率好,另外,此程序在keil编译器中已经编译通过。
- 2022-01-31 04:15:49下载
- 积分:1
-
OpenCl基础构架代码
应用背景密码暴力计算,大型数据计算都会用到,并行计算,本例程为通用openCL并行计算,基于nvidia平台下,例程综合了openCL的常用函数,平台创建、设备选择、内存分配、任务队列、核函数生成,可用本文件代码作为运行基础构架模板。关键技术
OpenCL常用函数构成的技术构架,可以在本代码基础之上适当修改,既可以应用于其他场合,免去繁杂的,重复配置函数的调用,本例程具有自动检测运行平台,运行设备。
- 2023-03-17 03:20:04下载
- 积分:1
-
secuential归并排序
secuential归并排序
- 2022-05-09 00:14:19下载
- 积分:1
-
cuda实现矩阵求逆
此程序包的矩阵求逆函数基于 CUDA 的实现包含对称的积极明确逆矩阵使用 GPU。用法,请参阅 testspd.cpp 中的示例。此外,一般块矩阵求逆通过高斯(pivotting) 没有消除。请参阅 testge.cpp 例如使用。注: GE 可能无法在单精度足够稳定。请参阅生成文件更改为双精度。
- 2022-07-16 13:09:40下载
- 积分:1
-
利用CUDA平台计算矩阵乘法的GPU编程
本程序为简易的CUDA编程,两个程序都是计算矩阵的乘法。其中Matrix1和Matrix2的区别是Matrix2使用了shared memory。每个程序都使用了串行和并行两种方式计算乘法,最后将并行的运算结果与串行运算结果对比,验证计算的正确性。同时,程序中利用CUDA计时模块统计了并行运算的耗时。因此可以得出使用shared memory后改善的运行时间。
- 2022-12-18 17:50:03下载
- 积分:1
-
GPU上CUDA实现N-Body
应用背景在GPU上实现N-BODY算法。N-Body模拟问题覆盖了自然科学的很多领域,从宇观的天体物理到宏观的流体动力学,直至微观的分子动力学。例如通过研究围绕着银河系的暗物质晕轮的形状和动力学特征来探索银河系形成过程,需要模拟数百万的星体和暗物质间的作用。现代生物物理学和化学中的许多研究,如细菌或植物体的光合作用膜处发生的光能向化学能的转化,染色体中DNA和蛋白质分子的描述,都需要模拟上千万的原子核分子的作用。关键技术N-Body问题的两个重要特征是: 第一点.计算规模大,因为无论是宇观的天体尺寸还是微观的分 子尺度.都包含了大量的粒子,粒子的规模大到数百万、千万。由于在 系统中任意的两个粒子问都存在着相互作用,因此商接计算粒子间的 相互作用的量级就是O(N^2); 第二点.系统是动态变化的。为了反应系统的具体变化.尤其是在微观分子结构中.要求时间步足够小。这两个特征决定了计算机模拟 时巨大的计算量。这对于任何扁性能的单台计算机来说都是一个很难突破的瓶颈.因此采用并行汁算是解决N-Body问题的必然选择。主要涉及数据划分和线程任务划分实现。
- 2022-12-08 07:20:03下载
- 积分:1
-
cuda并行计算
资源描述VS_cuda并行计算 两基于vs实现的.cu代码 简单的实现矩阵相乘和反转。
- 2022-05-21 15:38:13下载
- 积分:1