cuFINUFFT v1.2 cuFINUFFT是基于CPU代码单精度和双精度的类型1和2的二维和3维非均匀FFT的非常高效的GPU实现。 请注意,相对于v1.1,Python界面已更改。 有关详细信息,请参见 。 cuFINUFFT引入了几种算法创新,包括负载平衡,用于缓存感知访问的bin排序以及快速共享内存的使用。 我们的测试表明,在现代硬件上,与FINUFFT相比,加速度最高可提高10倍,比其他已建立的GPU NUFFT代码的速度最高可提高100倍: 它执行的转换可以总结如下:类型1将非均匀数据映射到二元或三元傅里叶级数,而类型2执行伴随运算(通常不是类型1的逆运算)。 这些转换以接近FFT的速度执行到用户指定的容差; 在幕后,这涉及详细的内核设计,自定义扩展/插值阶段以及由cuFFT执行的普通FFT。 有关转换及其在信号处理,成像和科学计算中的应用的完整数学描述,请参见。