语音数据经过预处理,提取特征参数,训练VQ模型,建立码本库,然后对测试数据集进行说话人识别,输出识别结果。
利用ALIZE产生I向量用于说话人识别
MFCC LPCC 语音识别
语音识别中进行语音的mfcc计算,获得mfcc的参数,为识别语音做基础
本项目建立了一个小的语音库(8男8女),编写mfcc函数提取出语音的mfcc特征,然后利用svm进行训练和测试,实现性别识别,并创建gui进行功能展示,正确率为93.75%。本代码功能尚比较简单,有待
本征音子说话人自适应算法在自适应数据量充足时可以取得很好的自适应效果,但在自适应数据量不足时会出现严重的过拟合现象。首先引入基于隐马尔可夫模型-高斯混合模型(HMM-GMM)的语音识别系统中本征音子说
在TI的DSK5402平台上构建了一个主要采用VQ方法的6个说话人识别系统。该系统采用了10阶的线性预测参数、10阶的线性预测倒谱参数及基音参数,提出了一种改进的LBG算法,以避免在迭代过程中产生空胞
一篇基于共性特征选择的短时说话人识别方法,利用说话人语音数据得到高斯混合模型,提取说话人之间的公共重叠部分,建立共性重叠模型和非重叠模型,根据这2个模型完成测试语音特征的选择。
语音信号处理实验教程配套matlab代码,GMM。可以实现基本的训练和识别。
DTW算法,与matlab自带算法类似,只是不需要转置矩阵了。(但是二者算出的值不一样,具体效果待测)