一种语音识别的语音自适应技术和语音属性后验
根据语音事件检测的自动语音识别是当前研究的热点问题。针对说话人语速变化导致模型适应性差的问题,提出一种语速自适应调整算法。该算法以语句为单位,采用连续变化的帧长与帧移间隔对语句进行归一化调整,使调整后速率与语料库平均速率一致,转换变量对模型训练的影响;另外,通过计算音位属性的后验概率矢量间夹角,得到测试集的语速,按采用训练模型的语速检测方法减轻了系统负担。此处将语速调整算法替换音位属性的提取值,替换音位属性特征进行非线性变换,最后采用隐式马尔科夫模型进行建模,实验表明:通过语速调整后,音素的平均持续帧数恒定,动态变化范围转换,使得音素识别率提升了1.3%。
暂无评论