能够识别输入的语音,有种语音选择,并把输入的语音转换为文字保存