TurboTransformers:一种快速且用户友好的运行时用于在CPU和GPU上进行变压器推断(BertAlbertGPT2Decoders等) 源码

prize4232 5 0 ZIP 2021-03-23 12:03:48

TurboTransformers:一种快速且用户友好的运行时,可在CPU和GPU上进行变压器推断通过在您的推理引擎中添加涡轮增压器,使变压器快速服务! 微信AI开放源代码的TurboTransformers具有以下特征。同时支持变压器编码器和解码器。支持实时可变长度输入。无需耗时的离线调整。您可以实时更改批处理大小和请求的序列长度。出色的CPU / GPU性能。后端通过手工制作的OpenMP和CUDA代码实现,并涉及一些创新技巧。完美的可用性。支持python和C ++ API。它可以用作PyTorch的插件。通过添加几行python代码可以获得端到端加速。

文件列表

TurboTransformers：一种快速且用户友好的运行时，用于在CPU和GPU上进行变压器推断（Bert，Albert，GPT2，Decoders等） (预估有个274文件)

.clang-format 21B

multi_headed_attention.cpp 17KB

transpose.cpp 26KB

seq_pool.cpp 6KB

utils.cpp 6KB

layer_norm.cpp 8KB

mat_mul.cpp 8KB

transpose_test.cpp 18KB

positionwise_ffn.cpp 5KB

multi_headed_attention_smart_batch.cpp 19KB

pybind.cpp 14KB

FindGperftools.cmake 2KB

cuda.cmake 880B

FindMKL.cmake 4KB

bert_model_test.cpp 7KB

bert_model.cpp 10KB

bert_model_example.cpp 8KB

matmul_benchmark.cpp 7KB

openblas.cmake 1KB

eigen.cmake 1KB

用户评论

暂无评论

onnx_transformers加速的NLP管道用于在CPU上进行快速推断使用Transformers和ONNX运行时构建源码

onnx_transformers 加速的NLP管道以进行快速推理 :rocket: 在CPU上内置 :hugging_face: 变压器和ONNX运行时。安装: pip install git+h

4 2021-02-07
PermissionsDispatcher一种声明性且全面的API用于处理Android运行时权限源码

权限分配器全面的Kotlin / Java支持 100%无反射 PermissionsDispatcher提供了一个简单的基于注释的API来处理运行时权限。该库减轻了编写一堆检查语句(无论是否已授

24 2021-02-07
ObjectiveKit快速友好的API用于一组强大的Objective C运行时函数源码

物镜套件 ObjectiveKit为一组功能强大的Objective C运行时函数提供了Swift友好的API。用法要使用ObjectiveKit: 在Swift文件顶部导入ObjectiveKi

14 2021-02-08
一种双绕组变压器经济运行的实用方法

介绍了并列运行双绕组变压器经济运行方式优化的方法。提出了一种变压器经济运行的时段控制法:根据短期负荷预测的数据确定未来1日的日负荷曲线,并将该曲线分段,再结合变压器经济运行理论,设置变压器在各个时段内

6 2021-02-22
kogito运行时Kogito运行时Kogito是一种云原生业务自动化技术用于构建可用于云的业务应用程序源码

Kogito Kogito是专注于云原生开发,部署和执行的下一代业务自动化平台。快速链接主页: : 指南和文档: : JIRA问题: : 要求 3.6.2或更高版本 11或更高版本(开发包) 可选

9 2021-02-01
BIDMat一种用于数据挖掘的CPU和GPU加速矩阵库.zip

BIDMat, 一种用于数据挖掘的CPU和GPU加速矩阵库 BIDMat是一个非常快的矩阵代数库。检查最新的基准测试。github发行版仅包含源代码。要构建系统，需要a，CUDA，以及一份 apa

11 2020-07-24
crun快速轻量的功能齐全的OCI运行时和用于运行容器的C库源码

n 快速,低内存的OCI容器运行时,完全用C编写。 crun符合OCI容器运行时规范( )。文献资料用户文档可。为什么要另外实施? 尽管Linux容器生态系统中使用的大多数工具都是用Go编写的,

7 2021-02-09
taichi生产和便携式编程语言用于在CPU和GPU上进行高性能稀疏和差异化计算源码

| | || 概述 Taichi (太极)是为高性能计算机图形学而设计的一种编程语言。它深深地嵌入在Python中,并且它的即时编译器将计算密集型任务转移到多核CPU和大规模并行GPU上。太极拳的

7 2021-02-21
Forward一个用于在NVIDIA GPU上进行高性能深度学习推理的库源码

转发-用于在NVIDIA GPU上进行高性能深度学习推理的库 [] 向前 Forward是一个用于在NVIDIA GPU上进行高性能深度学习推理的库。它提供了一个精心设计的方案,可以直接将Tenso

9 2021-03-23
一种应用于开关电源的高频平面变压器的设计.pdf

一种应用于开关电源的高频平面变压器的设计pdf,一种应用于开关电源的高频平面变压器的设计

11 2020-07-16

TurboTransformers:一种快速且用户友好的运行时用于在CPU和GPU上进行变压器推断(BertAlbertGPT2Decoders等) 源码

文件列表

用户评论

推荐下载