Ta上传的资源 (0)

针对tensorrt5.1实现的双线性上采样插件,插件实测无误。如果用nvidia的gpu,在推理的时候,采用tensorrt进行加速是一个很好的选择,虽然tensorrt没有开源。

采用cmake编译cuda向量加法。 在大量的C/C++的项目中都使用CMake来进行项目的管理,而CUDA又是很流行的并行计算库,利用CMake来构建CUDA项目就显得很有必要了,而且项目中使用的CMakeLists.txt基本框架一致。

利用cuda加速opencv图像处理的例子——交换mat的r,b通道。利用Cuda Runtime API、Cuda Driver API实现一些操作的并行加速,使用过程需要管理CPU与GPU之间的数据传输,内核函数调用参数的设置,内核函数的优化等。优点是处理过程受控于用户,用户可以实现更多的并行加
SUN 9

Hi3519A编译好的YOLOV3 demo百度网盘下载链接。海思3519A自带的sdk中是没有yolov3的demo例子的,这就让人很不开心,而且华为的人给的资料很乱,其次,很多的demo都是支持Hi3559A的,还没入坑的,推荐选Hi3559A进行开发。

我们一般使用的数据格式是voc2007的数据格式,有时我们也需要用coco数据格式,这种格式一般以json格式存储,那么如将voc2007格式的数据转成coco数据格式呢?这是python的代码实现,只用改路径就好。
VB 16

Faiss是Facebook AI团队开源的针对聚类和相似性搜索库,为稠密向量提供高效相似度搜索和聚类,支持十亿级别向量的搜索,是目前最为成熟的近似近邻搜索库。这里将其移植到Hisi3559a芯片上。采用aarch64-linux-gnu-gcc/gfortran交叉编译实现。注意:编译器不同,可能