自述文件 UPDATE(2021-02-03) :有关代码的最新更新,请参见 这是Kaldi的python包装器(还有另一个!)。 主要目标是能够在Pytorch中训练声学模型,以便我们能够 在培训期间使用MMI成本函数 使用NG-SGD进行仿射变换,从而可以使用SGE进行多GPU训练 目录 动机 该项目的主要动机是在Pytorch进行MMI培训。 这个想法是使用Kaldi中的现有功能,这样我们就不必重新实现任何东西。 为什么不使用现有的包装器? Pykaldi非常适合公开高级功能。 但是,许多事情仍然是不可能的(例如,加载NNet3模型并可以访问模型的参数)。 修改Pykaldi要求我们拥有Kaldi和CLIF的自定义版本。 此外,如果只是想将GPU中的张量转换为Kaldi CuMatrix效率不高(一般路线afaik将为Tensor GPU-> Tensor CPU-> Kaldi