Kubernetes(K8s)是一个开源的容器化应用管理工具,通过使用阿里的AiACC或者社区的horovod等分布式训练框架,可以将单机训练任务扩展为支持分布式的任务。Kubeflow社区的tf-operator支持Tensorflow PS模式,mpi-operator支持horovod的mpi allreduce模式,给深度学习训练带来更大的计算能力和灵活性。
基于阿里云强大计算能力和开源社区Kubeflow的深度学习解决方案充分利用Kube.Netes的灵活性和分布式训练框架
文件列表
基于阿里云强大计算能力和开源社区Kubeflow的深度学习解决方案.rar
(预估有个60文件)
基于阿里云强大计算能力和开源社区Kubeflow的深度学习解决方案
新建文本文档.txt
19B
ai-starter-master
.DS_Store
6KB
demo
2-1-tensorboard.jpg
780KB
1-1-tensorboard.jpg
919KB
3-1-tensorboard.jpg
268KB
1-start-with-mnist.ipynb
27KB
Bert-pretraining.ipynb
35KB
暂无评论