2 GPU 并行加速算法 GPU 具有高度并行的多流水线架构,使其非常适宜于FDTD 加速运算。与CPU 运算的多次循环逐网格迭代更新方式不同,GPU 可以实现多网格的同时迭代更新,配合GPU 的线程集指令执行机制,可以高效地利用流水线资源,隐藏流处理器与设备内存间的场量读写延时,从而实现FDTD 运算加速。 2.1 GPU 核心函数的并行 2.1.1 数据并行优化 OpenCL 支持按数据并行的编程模型和按任务并行的编程模型。数据并行是一种普遍意义上的并行方式,在程序中,常有一些循环操作,如果在循环的内部各个计算过程之间不存在相关性,则可以转换成并行循环,即数据并行。