Hadoop是用于大型企业数据集的分布式处理的最流行的开源框架,它在本地和云端环境中都有很多重要用途。深度学习对于语音识别,图像分类,AI聊天机器人,机器翻译等领域的企业任务非常有用,仅举几例。为了训练深度学习/机器学习模型,可以利用TensorFlow/MXNet/Pytorch/Caffe/XGBoost等框架。有时需要将这些框架进行组合使用以用于解决不同的问题。为了使分布式深度学习/机器学习应用程序易于启动,管理和监控,Hadoop社区启动了Submarine项目以及其他改进,例如一流的GPU支持,Docker容器支持,容器DNS支持,调度改进等。这些改进使得在ApacheHadoopY