图形处理器(graphic processing unit, GPU)的最新发展已经能够以低廉的成本提供高性能的通用计算。基于GPU 的CUDA (compute unified device architecture)和OpenCL (open computing language)编程模型为程序员提供了充足的类似于C 语言的应用程序接口(application programming interface, API), 便于程序员发挥GPU 的并行计算能力。采用图形硬件进行加速计算, 通过一种新的GPU 处理模型——并行时间空间模型, 对现有GPU 上的N-body 实现进行了分析, 从而提出了一种新的GPU 上快速仿真N-body 问题的算法, 并在AMD 的HD Radeon 5850 上进行了实现。实验结果表明, 相对于CPU 上的实现, 获得了400 倍左右的加速; 相对于已有GPU 上的实现, 也获得了2 至5 倍的加速。