基于正则化的与说话人相关的本机矩阵估计的说话人自适应

见地未来 21 0 PDF 2021-05-05 23:05:11

在有足够的适应性数据时,基于本机的说话人适应优于传统的最大似然线性回归(MLLR)和本征语音方法。然而,当仅提供几秒钟的适配数据时,它会遭受严重的过度拟合。在本文中,研究了各种正则化方法以获得更健壮的依赖于说话者的本征电话矩阵估计。逐元素的l1范数正则化(称为套索)鼓励本征电话矩阵稀疏,从而减少了有效自由参数的数量并提高了泛化能力。平方的l2范数正则化促进估计矩阵向零方向逐元素收缩,从而减轻了过度拟合的情况。按列的非平方l2范数正则化(称为组套索)在列级别上像套索一样起作用,从而鼓励了本征音矩阵中的列稀疏性,即,首选具有许多零列的本征音矩阵作为解决方案。每列对应一个本征电话,它是电话变化子空间的基本向量。因此,组套索试图防止子空间的维数超出必需的范围。对于非零列,组套索的作用类似于在列级别具有自适应加权因子的平方l2范数正则化。还研究了这些方法的两种组合,即弹性网(同时应用l1和平方的l2范数)和稀疏组套索(同时应用l1和列式非平方的l2

资源预览

用户评论

暂无评论

基于神经网络的说话人识别技术任务书

基于神经网络的说话人识别技术任务书，详细介绍了完成基于神经网络的说话人识别技术的要求

16 2019-01-22
论文研究基于HAAR小波的分级说话人辨识.pdf

为了对动态变化的决策表进行高效属性约简处理，在改进的分辨矩阵的基础上提出一种基于约简树的增量式属性约简算法IRART，该算法首先根据序贯属性约简算法对原决策表构造约简树，然后求出新增对象的分辨向量，并

17 2020-06-08
论文研究基于GMM的说话人识别技术研究.pdf

针对经典卡尔曼滤波器在滤波数学模型与实际过程的数学规律不匹配、滤波特性较差的情况，提出利用强跟踪卡尔曼滤波器对视频序列图像中的运动目标进行跟踪。该方法是在经典卡尔曼滤波递推公式中的一步验前误差方差阵中

84 2019-12-31
基于频谱图和局部二值模式的说话人识别

本文提出了一种基于声谱图的文本独立,闭集说话人识别方法动态时间规整(DTW)算法。预处理后的语音信号被分为一些块,然后进行计算以获得频谱的幅度,从而创建频谱图。本地二进制模式(LBP)运算符用于获

16 2021-05-04
基于DSP嵌入式说话人识别系统的设计

绍一种基于浮点型数字信号处理器(TMS320C6713),并通过语音识别说话人身份的实用系统。为构建一个稳定实用的基于DSP说话人识别系统。以Mel倒谱系数作为特征参数,采用高斯混合模型作为识别模型,

17 2020-07-30
论文研究基于听觉机理的鲁棒说话人识别.pdf

基于听觉机理的鲁棒说话人识别，游大涛，韩纪庆，研究表明，从信号处理的角度来说听觉中枢编码方式与稀疏表示具有相似性，可以用基于统计学习得到的原子近似听觉中枢基本编码单元

6 2020-07-23
作为说话人识别特征参量的MFCC的提取过程

作为说话人识别特征参量的MFCC的提取过程，Mel频率倒谱系数（MFCC）是语音信号的频域参数，它是一种基于人耳对语音频率的非线形感知特征的描述

59 2019-10-09
用matlab实现说话人识别例子

用matlab实现说话人识别的一个案例。

29 2020-03-04
说话人识别MATLABGUI界面设计

说话人识别的基于MATLABGUI的界面制作，程序已经经过验证可以实现，里面包含了语音识别的文件库，也可以自己建立文件库进行语音识别，主要用了DTW和VQ的说话人识别。

18 2019-05-15
Audio Segmentation Toolkit说话人分类系统

Audio Segmentation Toolkit Speaker Classification System

27 2019-06-27

基于正则化的与说话人相关的本机矩阵估计的说话人自适应

资源预览

用户评论

推荐下载