SIMD_Benchmarking:基本矩阵和向量运算的性能比较

qqdigestion62278 11 0 zip 2024-07-18 13:07:40

SIMD基准测试测试基本矩阵和向量运算与其SIMD对应物的相对性能。每个操作的时间平均超过10000次运行。使用随机单精度浮点数的4x4矩阵或4D向量。对AVX 128位(XMM)和256位(YMM)寄存器执行的单独计算。 AVX2/FMA3（128位）指令集（融合乘加）需要Intel Haswell CPU。所有操作都经过了相当大的优化。SIMD矩阵乘法使用线性组合方法。

在带有Intel i5-4278u 2.6 GHz双核Haswell CPU的2014 rMBP上进行测试。操作系统：在VMWare Fusion 7上运行的Windows 8.1。使用MSVC++2012编译： x64 mode、/arch:AVX、/fp:Fast通过__rdtsc()在CPU时钟周期中计时。

为了更好地理解向量和矩阵运算，可以参考以下资源：

资源预览

文件列表

SIMD_Benchmarking-master.zip (预估有个13文件)

SIMD_Benchmarking-master

Timer

Timer.cpp 1KB

GlobalTimer.h 650B

Timer.h 684B

Vect4D.h 568B

SIMD Benchmarks.vcxproj 13KB

Matrix.h 5KB

SIMD Benchmarks.vcxproj.filters 1KB

Vect4D.cpp 1KB

main.cpp 3KB

README.md 1KB

Matrix.cpp 2KB

SIMD Benchmarks.sln 2KB

.gitignore 763B

用户评论

暂无评论

各种混沌系统性能比较研究

混沌系统在图像和视频加密方面的应用研究日益增多。为了筛选出更适合应用于信息加密的混沌系统,对一维Logistic系统、四维广义Henon系统、三维Lorenz系统、三维Rossler系统、四维Chen

13 2020-10-28
摩卡BSM与IBM Tivoli性能比较

摩卡BSM与IBMTivoli性能比较

22 2019-09-22
排序算法性能比较课程设计

插入排序，归并排序，快速排序，希尔排序，冒泡排序，选择排序。包括源程序，C语言，设计报告。

22 2019-09-06
相关代码JNI与JNA性能比较

分别用JNI和JNA的方式建立dll，dll中包含一个get方法和一个set方法，在java端进行循环调用1000*1000次，比较所耗费的时间。结论：JNI消耗的总时间（16ms） JNA消耗的总

45 2019-01-22
java中ArrayList与LinkedList性能比较

今天看一框架的代码，看到有些可以使用ArrayList的地方使用的是 LinkedList，用到的情景是在一个循环里面进行顺序的插入操作。众所周知java里面List接口有两个实现ArrayLis

27 2020-09-01
六种排序算法性能比较

使用java描述了常见的六种排序算法，分别是直接插入排序，二分插入排序，选择排序，冒泡排序，快速排序以及二路归并排序，同时在不同的基数下能够查看各种排序算法的运行时间，通过比较发现当数组个数很大时，二

57 2019-03-09
快速无损压缩算法性能比较

Performance comparison of fast lossless compression algorithms

60 2019-06-25
JS字符串连接性能比较

四、似乎色香味俱全了，但是吃下去的功效如何？

13 2021-12-17
C++标准容器性能比较分析

使用C++标准容器进行性能测试是一个非常重要的任务，可以通过比较分析得出最优的结果。在本文中，我们将为您介绍如何使用C++标准容器进行性能测试，并分析比较不同容器的性能表现。我们将使用vector、d

12 2023-03-24
DCS系统性能比较表.pdf

性能特点1、系统配置规模大/覆盖宽具有可靠性、实时性、开放性。2、能够兼容非CENTUM系统部件，高可靠的定时通讯。 3、双冗余C

12 2020-07-20

SIMD_Benchmarking:基本矩阵和向量运算的性能比较

资源预览

文件列表

用户评论

推荐下载