ONNX Runtime是一个跨平台的推理和培训加速器,与许多流行的ML / DNN框架兼容,包括PyTorch,TensorFlow / Keras,scikit-learn等。 许多用户可以从ONNX Runtime中受益,包括那些希望: 提高各种ML模型的推理性能 减少培训大型模型的时间和成本 使用Python进行培训,但可以部署到C#/ C ++ / Java应用程序中 在不同的硬件和操作系统上运行 在多个不同框架中创建的支持模型 自2019年10月以来, API稳定且可投入生产,可实现更快的客户体验和更低的成本。 2020年5月在预览中引入了功能。 此功能支持针对变压器模型在