详细对于CUDA中内存存储问题的编程,以点积的例子来展现,可以在GPU上运行。