里面包含Parellel Prefix Sum算法,非常有利于GPU编程,可以加速程序运行