语音中的情感识别在发展情感和智能人机交互中起着重要作用。 这项工作的目标是建立一个自动情绪变化检测(AEVD)系统,以确定连续语音中的每个情绪显着部分。 我们专注于愤怒中性语音中的情绪检测,这在AEVD的最新研究中很常见。 这项研究提出了一种新颖的AEVD框架,该框架使用多尺度滑动窗口(MSW-AEVD)通过融合包含移位的所有滑动窗口的决策来为每个窗口移位分配一个情感类别。 首先,介绍了固定长度的滑动窗口作为基本过程,研究了几种不同的融合方法。 然后采用多尺度滑动窗口来支持具有不同时标特征的多分类器,其中提供了另外两种融合策略。 最后,应用后处理来完善最终输出。 绩效评估是在柏林公共数据库EMO-DB上进行的。 我们的实验结果表明,提出的MSW-AEVD明显优于传统的基于HMM的AEVD。