SIMD Matrix Vectorization:使用Intel AVX Intrinsics对矩阵进行向量化。具有其他优化功能可以利用局部性来减少高速缓存

qqcompetitive25801 22 0 ZIP 2021-05-03 09:05:41

SIMD矩阵矢量化依赖项/安装 Your CPU must support Intel AVX Intrinsics 运行代码编译: Run the compile_all.sh bash script from the source directory with sh compile_all.sh 跑步: Run the tester_transpose.sh or tester_transpose_block.sh (or other) script from the source directory with sh tester_transpose_block.sh (This outputs a bunch of performance info in CSV format, which is available in a much more readable form

文件列表

SIMD-Matrix-Vectorization-master.zip (预估有个36文件)

SIMD-Matrix-Vectorization-master

Part1

CSVs

outputSequential.txt 2KB

localMachineOutputBlock.txt 849B

localMachineOutputSequential.txt 2KB

outputBlock.txt 852B

Source

transpose_block_bash 15KB

transpose_bash 15KB

transpose_bash_O2 13KB

transpose_bash.cc 2KB

tester_transpose_block.sh 438B

transpose_bash_O3 13KB

compile_all.sh 250B

transpose_block_bash.cc 3KB

tester_transpose.sh 761B

Deliverables

localMachineOutputBlock.pdf 10KB

outputBlock.pdf 10KB

localMachineOutputSequential.pdf 35KB

outputSequential.pdf 27KB

readmeImages

deliverableExample.png 143KB

README.md 1KB

Part2

CSVs

localMachineOutputVectorized.txt 4KB

outputVectorized.txt 4KB

outputSequential.txt 2KB

localMachineOutputSequential.txt 2KB

Source

matvec_bash 16KB

tester_matvec_sequential.sh 740B

matvec_bash.cc 2KB

simd_matvec_bash 24KB

matvec_bash_O3 13KB

tester_matvec_vectorized.sh 549B

simd_matvec_bash.cc 14KB

compile_all.sh 340B

matvec_bash_O2 13KB

Deliverables

part2OutputVectorized.pdf 35KB

part2LocalMachineOutputSequential.pdf 35KB

part2OutputSequential.pdf 35KB

part2LocalMachineOutputVectorized.pdf 35KB

用户评论

暂无评论

太强大了可以利用js实现页面采集下载

简直太强大了，利用js解析页面进行采集，不懂正则的人也可以进行数据采集保存，只要你懂js的dom解析取得你想要的数据就可以了。

23 2018-12-07
Intel Matrix Storage Manager

Intel Matrix Storage Manager 用来启动AHCI的驱动程序

54 2018-12-25
Intel Matrix硬盘驱动

安装操作系统如果系统找不到硬盘驱动程序，系统试试这个哦,须用软盘来启动按F6安装，U盘不可以。

36 2018-12-25
基于多核平台的高速缓存感知的实时调度策略

多核结构已经被大多数的芯片制造商所采用。大多这样的芯片采用的是层次化的高速缓存共享的结构。为了有效的利用处理资源,调度算法就需要感知这些缓存。本文中我们在调度实时任务时探索不同的启发值来改善缓存性能。

9 2020-09-19
MySQL高速缓存启动方法及参数详解query_cache_size

主要介绍了MySQL高速缓存启动方法及参数详解(query_cache_size),需要的朋友可以参考下

10 2020-12-13
论文研究多核环境下高速缓存配置和架构研究.pdf

多核环境下高速缓存配置和架构研究，汪伟斌，韩峰，处理器和存储器速度之间的剪刀差现象和多核发展的趋势，使存储墙问题越来越严重，高速的存储体系成为高性能计算的保证。多核环境

14 2020-02-23
论文研究基于循环的指令高速缓存访问预测方法.pdf

为了减少高速缓存访问功耗,提出了一种针对循环的基于历史访问路径的指令高速缓存访问预测方法。该方法以循环作为高速缓存访问路预测行为开启的先决条件,通过指令高速缓存的历史访问路径训练预测器。当循环体再次进

18 2020-01-05
高自旋理论和星积函数类的自旋局部性

高旋距规理论的自旋局部性分析是根据最近在[1]中提出的β→-∞极限位移同伦的星积函数类来表示的，其中所有ω2C2高旋度顶点均已显示是自旋局部的。对于β→-∞极限移位收缩同态，我们确定函数类别H+0$$

11 2020-05-07
利用ASON ASTN技术来减少运营成本

类似ASON/ASTN（自动交换光网络/自动交换传输网络）这样的新兴技术、以及类似光UNI这样的标准接口都将有望实现电信网络的自动化运行，能更效率地服务用户和利用带宽，并减少重新配置设备所引发的人工影

14 2020-07-17
matrix矩阵变换

androidmatrix矩阵变换setprepost区别

36 2019-05-21

SIMD Matrix Vectorization:使用Intel AVX Intrinsics对矩阵进行向量化。 具有其他优化功能可以利用局部性来减少高速缓存

文件列表

用户评论

推荐下载

SIMD Matrix Vectorization:使用Intel AVX Intrinsics对矩阵进行向量化。具有其他优化功能可以利用局部性来减少高速缓存