初步介绍GPU和CUDA,以矩阵乘法的具体实现为例,分析基于CUDA架构的数据并行计算。