针对基于短时能量和短时过零率的语音端点检测算法不能自适应环境,在低信噪比时性能较差问题,提出了一种新算法。该算法利用最小短时能量评估环境噪声,优化参数提取算法,提高了参数本身的抗噪能力和自适应能力,再
:针对语音复读系统等背景噪声相对较小且稳定的实际应用环境,提出一种改进的基于时域分析的句子语音端点检测算法。因为在此类应用环境中,对句子语音端点检测的干扰因素较少,且一般需要实现快速的句子语音端点检测
噪声环境下的鲁棒性语音端点检测算法研究,介绍了端点检测方面的理论和方法。
为提高复杂噪声环境下语音信号端点检测的准确率,提出一种基于梅尔频谱倒谱系数(MFCC)距离的多维特征语音信号端点检测算法。通过计算语音信号的MFCC距离,结合短时能量和短时过零率对特征距离进行修正,并
端点检测是语音识别系统中很重要的一部分,端点检测的准确性直接影响语音识别系统的性能。提出了一种新颖的两阶段端点检测方法:第一阶段采用基于短时能量的边缘检测方法得到第一阶段端点;第二阶段采用统计直方图聚
利用opencv实现harris算法,进行角点检测,并采用邻域极大值方法对错误的角点进行抑制。可以在VS2010中运行!
c++语音识别demo
DTW语音识别(偶然模板训练法),能够识别,但是仍有需要改进的地方,相互学习吧
摘要 语音端点检测是指从一段语音信号中准确的找出语音信号的起始点和结束点它的目的是为了使有效的语音信号和无用的噪声信号得以分离因此在语音识别语音增强语音编码回声抵消等系统中得到广泛应用 目前端点检测方
VAD基于短时能量的端点检测函数,AudioVAD函数包括两个参数:short*的数据,long的数据长度。返回值为int类型的1或者0,表示该段数据是voice还是silence。并附上用于测试的p