SIMD_Benchmarking:基本矩阵和向量运算的性能比较
SIMD基准测试测试基本矩阵和向量运算与其SIMD对应物的相对性能。每个操作的时间平均超过10000次运行。使用随机单精度浮点数的4x4矩阵或4D向量。对AVX 128位(XMM)和256位(YMM)寄存器执行的单独计算。 AVX2/FMA3(128位)指令集(融合乘加)需要Intel Haswell CPU。所有操作都经过了相当大的优化。SIMD矩阵乘法使用线性组合方法。
在带有Intel i5-4278u 2.6 GHz双核Haswell CPU的2014 rMBP上进行测试。操作系统:在VMWare Fusion 7上运行的Windows 8.1。使用MSVC++2012编译: x64 mode、/arch:AVX、/fp:Fast通过__rdtsc()在CPU时钟周期中计时。
为了更好地理解向量和矩阵运算,可以参考以下资源: