armv8的白皮书Arm Architecture Reference Manual Armv8for Armv8A architecture armv8的白皮书,为官方文档包含架构讲解,neon函数,指令集等。文件为百度网盘下载链接。
python多文件夹文件夹依赖关系制作pip安装包 将文件夹打包成pip安装包,网络上大多是单个文件夹,且不存在文件(同文件夹/不同文件夹)直接的相互调用。使用环境有限。该包尝试将多个文件夹/文件之间存在相互调用的项目打包成一个pip包。
tensorrt5.1双线性上采样插件 针对tensorrt5.1实现的双线性上采样插件,插件实测无误。如果用nvidia的gpu,在推理的时候,采用tensorrt进行加速是一个很好的选择,虽然tensorrt没有开源。
cuda向量加法cmake编译 采用cmake编译cuda向量加法。 在大量的C/C++的项目中都使用CMake来进行项目的管理,而CUDA又是很流行的并行计算库,利用CMake来构建CUDA项目就显得很有必要了,而且项目中使用的CMakeLists.txt基本框架一致。
opencv_cuda.tar.gz 利用cuda加速opencv图像处理的例子——交换mat的r,b通道。利用Cuda Runtime API、Cuda Driver API实现一些操作的并行加速,使用过程需要管理CPU与GPU之间的数据传输,内核函数调用参数的设置,内核函数的优化等。优点是处理过程受控于用户,用户可以实现更多的并行加
AMD APP SDK v2.8Windows64.exe的安装文件 64位windows amd平台的opencl安装软件。安装之后sample在:C:\Users\xx\Documents\AMD APP\
Hi3519A编译好的YOLOV3demo百度网盘下载链接 Hi3519A编译好的YOLOV3 demo百度网盘下载链接。海思3519A自带的sdk中是没有yolov3的demo例子的,这就让人很不开心,而且华为的人给的资料很乱,其次,很多的demo都是支持Hi3559A的,还没入坑的,推荐选Hi3559A进行开发。
pig_coco.py 我们一般使用的数据格式是voc2007的数据格式,有时我们也需要用coco数据格式,这种格式一般以json格式存储,那么如将voc2007格式的数据转成coco数据格式呢?这是python的代码实现,只用改路径就好。
faiss_install.zip Faiss是Facebook AI团队开源的针对聚类和相似性搜索库,为稠密向量提供高效相似度搜索和聚类,支持十亿级别向量的搜索,是目前最为成熟的近似近邻搜索库。这里将其移植到Hisi3559a芯片上。采用aarch64-linux-gnu-gcc/gfortran交叉编译实现。注意:编译器不同,可能