cufinufft:GPU上2D和3D类型1和2的非均匀快速傅立叶变换 源码
cuFINUFFT v1.2 cuFINUFFT是基于CPU代码单精度和双精度的类型1和2的二维和3维非均匀FFT的非常高效的GPU实现。 请注意,相对于v1.1,Python界面已更改。 有关详细信息,请参见 。 cuFINUFFT引入了几种算法创新,包括负载平衡,用于缓存感知访问的bin排序以及快速共享内存的使用。 我们的测试表明,在现代硬件上,与FINUFFT相比,加速度最高可提高10倍,比其他已建立的GPU NUFFT代码的速度最高可提高100倍: 它执行的转换可以总结如下:类型1将非均匀数据映射到二元或三元傅里叶级数,而类型2执行伴随运算(通常不是类型1的逆运算)。 这些转换以接近FFT的速度执行到用户指定的容差; 在幕后,这涉及详细的内核设计,自定义扩展/插值阶段以及由cuFFT执行的普通FFT。 有关转换及其在信号处理,成像和科学计算中的应用的完整数学描述,请参见。
文件列表
cufinufft:GPU上2D和3D类型1和2的非均匀快速傅立叶变换
(预估有个107文件)
CHANGELOG
2KB
spreadinterp2d.cu
25KB
spread2d_wrapper.cu
20KB
memtransfer_wrapper.cu
12KB
cufinufft.cu
18KB
spread3d_wrapper.cu
38KB
spreadinterp3d.cu
32KB
.bumpversion.cfg
803B
ker_horner_allw_loop.c
50KB
utils_fp.cpp
2KB
暂无评论