实验要求: 参考例程中的Optimazation文件夹中的方法,把实验二中的矩阵相乘程序优化(E=A*B+C*D) 例程中的Optimazation的说明: Optimazation 优化过程  未经优化的C语言程序:C program - Un Optimzied  使用汇编语言优化程序 :Asm program Un Optimized  使用硬件循环优化程序: Hardware Loop  利用两个乘法累加器优化程序 :using 2 MAC operation  利用并行指令优化程序:using multi-instructions  利用数据的分块存放优化程序:sepe