1、在cpu端使用多线程利用系统中的多gpu(如果系统中有n个gpu,可以指定任意个gpu参与计算)执行多个任务(可以是任意个),可以自由设定任务数量和任务队列大小。2、在同一个gpu上以不同的顺序执行多个任务(每个任务可能有多个kernel函数),并且统计不同的顺序序列,每个任务执行的时间和每个任务所有kernel执行时间;同时也可以每次执行一个任务序列。3、和2中的类似,主要实现单gpu上所有任务的kernel不同的执行序列对执行时间的影响。以上实现的程序,主要用来考察不同的执行顺序(包括任务级和核函数级的各种不同顺序)对gpu功耗的影响,程序中部分参数怎么改、怎么添加任务,可以给我留言。