CUDA程序,GPU上实现的两个矩阵相乘,并与CPU相乘进行对比