采用两种数据结构CTR和Ellpackr,分别存储大型的稀疏矩阵中的非零元素。并将在GPU下运行的矩阵相乘运算和在CPU下的矩阵相乘运算进行性能比较。