本文探讨了在高性能计算环境下,基于OpenMP的通用矩阵乘法的实现和优化方法。通过构造基于Pthreads的并行for循环分解、分配和执行机制,实现了对计算任务的高效并行处理。该方法能够显著提升矩阵乘法运算的性能和效率,进而加速高性能计算应用的执行速度。
OpenMP并行计算通用矩阵乘法在高性能计算中的优化实现
文件列表
高性能计算导论实验5-通用矩阵乘法基于OpenMP的实现及优化.zip
(预估有个12文件)
libparallel_for.so
16KB
Makefile
339B
parallel_for.c
750B
GEMM_omp_static.c
2KB
GEMM_omp_default.c
2KB
test.sh
589B
高性能计算导论实验5-通用矩阵乘法基于OpenMP的实现及优化-实验报告.docx
763KB
parallel_for.h
208B
GEMM_omp.c
3KB
GEMM.c
2KB
暂无评论