对于一段给定的语音,进行分帧等处理,提取其高阶统计量