CFU游乐场 需要更快的ML处理器? 自己做! 该项目提供了一个框架,一个工程师,实习生或学生可以用它来设计和评估改进的基于FPGA的“软”处理器,特别是增加的机器学习(ML)任务的性能。 目的是抽象出大多数基础结构细节,以便用户可以快速上手,并专注于添加新的处理器指令,在计算中利用它们并测量结果。 该项目可实现处理器改进方面的快速迭代-每天多次迭代。 这是最高级别的工作方式: 选择一个TensorFlow Lite模型; 提供量化的人员检测模型 在Arty FPGA板上执行推理以获取每层的周期数 选择一个TFLite运算符进行加速,并深入研究该代码 设计可以替代多个基本操作的新指令 构建执行新指令的自定义功能单元(少量硬件) 修改TFLite / Micro库内核以使用新指令,这些指令可以作为内在函数调用语法使用。 重建FPGA Soc,重新编译TFLM库,然后重新运行以评估