cuda7.0:新功能实现主机多线程多流之间实现kernel并行。主机的每个线程分配一个流采用这个新特性可以实现多流之间的kernel并发执行