语音识别是计算机软件识别口语中的单词和短语,并将其转换为可读文本的能力。那么如何在 Python 中将语音转换为文本?我们不需要从头开始构建任何机器学习模型,该库为我们提供了各种著名的公共语音识别 API 的便捷包装。使用 pip 安装库:Okey,打开一个新的 Python 文件并导入它:确保当前目录中有一个包含英语语音的音频文件 :该文件是从 LibriSpeech 数据集中获取的,但是您可以带上任何想要的东西,只需更改文件名,就可以初始化语音识别器:以下代码负责加载音频文件,并使用 Google Speech Recognition 将语音转换为文本:这需要几秒钟才能完成,因为它将文件上传到 Google 并获取了输出,这是我的结果:。您还可以在 record () 函数中使用 offset 参数在偏移几秒钟后开始记录。

使用Python将语音转换为文本的方法

使用Python将语音转换为文本的方法