目的:使用CNN卷积神经网络实现语音识别步骤:(1)预处理。首尾端的静音切除,降低对后续步骤造成的干扰,然后进行声音分帧,把声音切开成帧,,各帧之间一般是有交叠。(2)特征提取。运用的算法为倒谱系数(MFCC),把每一帧波形变成一个包含声音信息的多维向量;(3)RNN模型训练。有了特征,就可以使用TensorFlow完成模型的建立和训练了。(4)验证模型。目标:对相应的声音数据进行分类,例如数据的是数数的数据,能够输出对应的数字。