这是一个pytorch版本的语音识别,技术其中使用了ctcloss和transformers作为lossfn和语言模型