Kaldi离线转录器 更新 2018-10-31 引入了一种新的JSON格式,用于保存所有信息,以转录(说话者,单词,时间) 字幕现在分为较短的部分 TRS文件现在包含转弯而没有发音中断 2018-09-12 更新了扬声器ID型号 2018-08-31 添加了用于使用爱沙尼亚模型构建Docker映像的Dockerfile,还提供了预构建的映像,请参见。 2018-08-21 更改了说话人ID系统,以使用Kaldi的本地i-vector评分。 这意味着Tensorflow和Keras不再需要进行说话者识别。 2018-08-08 一些重构,新模型以及RNNLM记录。 而且,现在使用具有特殊unknkwon字处理的解码,这使得产生不在LM中的字成为最终输出成为可能。 详细信息将在以后添加。 2017-05-29 将基于Kaldi的发言人ID替换为基于DNN的自定义实现。 需要Ke