TensorflowASR 集成了Tensorflow 2版本的端到端语音识别模型,和RTF(实时率)在0.1左右 目前集成了中文的CTC \ Transducer \ LAS三种结构 当前还在开发阶段 欢迎使用并反馈bug |中文版 梅尔层 参照librosa库,用TF2实现了语音频谱特征提取的层,这样在跨平台部署时会更加容易。 使用: am_data.yml use_mel_layer: True mel_layer_type: Melspectrogram #Spectrogram trainable_kernel: True #support train model,not rec