masr:中文语音识别; 普通话自动语音识别; 源码
MASR中文语音识别 MASR是一个基于端到端的深度神经网络的中文普通话语音识别项目。 原理 MASR使用的是门控卷积神经网络(Gated Convolutional Network),网络结构在Facebook在2016年提出的Wav2letter。但是使用的激活函数不是ReLU HardTanh ,而不是GLU (门控线性单元)。因此根据我的实验,使用GLU的收敛速度比HardTanh要快。如果您想要研究卷积网络用于语音识别的效果,这个项目可以作为一个参考。 以下用字错误率CER来假定模型的表现,CER =编辑距离/句子长度,越低越好 大致可以理解为1-CER就是识别准确率。 模型使用AI
文件列表
masr-master.zip
(预估有个27文件)
masr-master
train.py
4KB
models
trainable.py
4KB
base.py
1KB
__init__.py
0B
conv.py
2KB
data.py
3KB
beamdecode.py
1KB
images
暂无评论