Floyd-Warshall算法是图论中APSP(All-Pair Shortest Paths )问题的经典算法,为了加快计算速度,提出使用GPU通用计算来实现。文章先从算法的原理入手,层层深入,提出了可以在GPU上运行的并行F-W算法。之后,又根据矩阵分块的原理和GPU共享存储器的使用,实现了改进的GPU并行F-W算法。通过大量测试实验,得到了该GPU并行程序相对于传统CPU并行程序产生超过百倍的加速比的结论。
基于GPU的并行APSP问题的研究
用户评论
推荐下载
-
论文研究基于Spark的并行Eclat算法.pdf
通过对Spark大数据平台以及Eclat算法的深入分析,提出了基于Spark的Eclat算法(即SPEclat)。针对串行算法在处理大规模数据时出现的不足,该方法在多方面进行改进:为减少候选项集支持度
43 2019-09-14 -
基于FPGA的ARM并行总线研究与仿真
摘要:通过EP2C20Q240 器件和LPC2478 处理器,研究ARM 应用系统外部并行总线的工作原理和时序特性,以及在FPGA 中进行双向总线设计的原则,设计并实现了FPGA 并行总线.借助Qua
5 2021-05-03 -
论文研究基于Spark框架的CNM算法并行研究.pdf
基于Spark框架的CNM算法并行研究,郑思远,,针对社团发现算法直接应用于大规模网络时计算效率过低的问题,提出采用Spark并行计算框架对CNM社团发现算法进行并行化实现。利用Spar
24 2020-03-21 -
论文研究基于网格的CG并行计算研究.pdf
分析了传统分布式并行计算和网格,以及并行计算技术应用中存在的问题,将LogP并行计算模型拓展到网格上,给出双层LogP模型和设计策略。针对网格特点对CG并行算法进行了改进,并取得了很好的效果。
19 2020-07-16 -
基于GPU的矩阵乘法优化研究_殷建.caj
以稠密矩阵向量乘法、稀疏矩阵向量乘法作为规则核心算法与非规则应用核心算法的代表进行研究。采用面向众核GPU的高速缓存分块方法设计更优的基于众核GPU稠密矩阵向量乘算法。
24 2019-08-17 -
基于GPU的SC LDPC码译码加速研究.pdf
基于GPU的SC-LDPC码译码加速研究
10 2021-04-04 -
基于GPU的LCS算法加速机制研究与实现
协议特征识别技术中用到了一种重要的LCS算法,它是一种字符串比对算法,提取出字符串中的最长连续公共子串。然而,通过理论分析和实验表明:这个查找过程是一个时间复杂度较高的运算过程,如果输入的数据分组比较
7 2021-02-18 -
论文研究基于GPU的风中树木物理动画.pdf
采用非均匀梁作为树枝物理模型,分析了梁的弯曲效应,推导出挠度曲线表达式,并对其运用多项式最小二乘法拟合,将拟合后的简洁表达式预计算于纹理中,有效降低了实时计算量。为平衡CPU与GPU的负载,设计了分层
13 2021-04-17 -
论文研究基于Linux的并行计算的研究与实现.pdf
基于Linux的并行计算的研究与实现,陈思思,赵晶玲,并行计算,就在并行计算机系统上进行数据和信息的并行处理,通常也称作高性能计算(High Performance Computing)或超级计算(S
22 2020-07-17 -
一种基于GPU的地形顶点法向量并行计算方法
为实现三维地形场景实时光照和阴影,采用顶点周围四点高程和GPU(显卡)寄存器绑定方法,借助顶点缓冲区和顶点着色器实时计算顶点法向量,对比主流地形着色算法,实验验证了GPU法向量实时计算效率和显卡兼容性
7 2020-06-02
暂无评论