基于特征空间非线性流形的语音识别声学模型

zy35344 19 0 PDF 2021-03-22 08:03:23

从语音信号声学特征空间的非线性流形结构特点出发,利用流形上的压缩感知原理,构建新的语音识别声学模型。将特征空间划分为多个局部区域,对每个局部区域用一个低维的因子分析模型进行近似,从而获得混合因子分析模型。将这些相关状态的观测矢量限定在该非线性低维流形结构上,推导得到其观测概率模型。最终,每个状态由一个服从稀疏约束的权重矢量和几个个服从标准正态分布的低维局部因子矢量所决定。文中指定了局部区域潜在维数的确定顺序及模型参数的迭代估计算法。基于RM语料库的连续语音识别实验表明,在传统的高斯混合模型(GMM)和子空间高斯混合模型(SGMM),新声学模型在测试集上的平均词错误率分别相对下降了33.1%和9.2 %。

基于特征空间非线性流形的语音识别声学模型

用户评论
请输入评论内容
评分:
暂无评论