随着网络数据量的暴增与计算机算力的发展,近些年来深度学习领域取得的重大的发展,许多传统机器学习领域无法解决的问题都在深度学习中取得突破。深度卷积神经网络是深度学习中的一中网络结构,与传统的全连接网络相比,采用卷积实现局部连接和权值共享,能够有效的解决参数爆炸的问题,广泛的被应用在计算机视觉领域。然而由于参数训练过程计算量太大,滑动卷积矩阵乘计算非常的费时,完成一个卷积神经网络模型的训练往往需要消耗大量的时间,针对这个问题,本次实验将构建一个基于CUDA架构的编程环境,采用CUDA/C++编程实现二维的卷积的并行计算,通过对比GPU实现与CPU实现,调整不同参数,分析并行技术对程序性能的提升效果