CUDA可伸缩并行编程, 中文版。NVIDIA工程师写的论文,里面有一些CUDA编程的小技巧,对于使用gpu进行机器学习实践有帮助