Deep Speed Chat是基于微软Deep Speed深度学习优化库开发而成,具备训练、强化推理等功能,还使用了RLHF(基于人类反馈的强化学习)技术,可将训练速度提升15倍以上,而成本却大大降低。当地时间4月12日,微软正式推出Deep Speed Chat训练工具,帮助用户轻松训练类ChatGPT等大语言模型。Deep Speed Chat提供了“傻瓜式”操作,使用户能够以最短的时间、最高效的成本训练类ChatGPT大语言模型。使RLHF训练真正在AI社区普及,让ChatGPT及类似模型引发了AI行业的一阵风潮。使用Deep Speed Chat,一个130亿参数的类ChatGPT模型,训练时间只需要1.25小时。使RLHF训练真正在AI社区普及,让ChatGPT及类似模型引发了AI行业的一阵风潮。