暂无评论
为了提高垃圾收集效率,降低垃圾收集耗费时间,提出一种基于LISP2算法的并行节点复制垃圾收集算法,给出了在CUDA环境下该算法的实现。实验结果显示,该算法在CUDA环境下能有效提高垃圾收集效率。
cuda源程序,gpu计算入门参考,《GPU高性能运算之cuda》里面的源程序
本书的主要目的是提出可以在许多应用领域的许多情况下使用的并行编程技术,并使读者能够开发正确而有效的并行程序。
Fundamental Optimizations in CUDA Optimization Overview GPU architecture Kernel optimization — Mem
利用GPU高性能的并行计算能力进行大量数据处理,从GPU的微架构深入分析了GPU并行计算的实现原理
这是一个介绍CUDA演示文稿。介绍了CUDA的详细资料
多核集群上的高性能MapReduce平台的研究与实现
这是我在实验室给同学们讲解的GPU时用的PPT,主要是对GPU一些基础知识的科普及普及,方便给初学者对GPU有个大概的了解
根据需要使用正确的存储器,减少对GPU片 外的显存的读取,提高计算密集度。编写调试,实现算法功能,验证结果的准 确性。从各个方面进行优化,提高执行单元利用 率,尽可能隐藏访存延时。实现流操作,协调与C
CUDA是一种专门为提高并行程序开发效率而设计的计算架构。在构建高性能应用程序时,CUDA架构可充分发挥GPU的强大计算功能,颇受广大开发者拥趸。本书以并行编程实践者视角,展示了全面、快速提升CUDA
暂无评论