语音数字识别使用HTK工具包训练模型来识别语音数字。安装HTK工具包的安装在每个平台上都有很大差异。该项目带有一个Vagrantfile以简化项目的设置。Vagrant将提供一个包含Ubuntu 32位的虚拟机并安装HTK。有关更多详细信息,请参阅。由于HTK的分发政策,您必须在官网上注册并下载软件包。在provision文件夹添加压缩包(HTK-3.4.1.tar.gz)。您现在已准备好运行Vagrant。执行以下命令:

vagrant up

vagrant ssh

cd /vagrant

用法

您可以使用命令./start-htk.sh创建模型并训练它。最终模型将存储在文件夹Models/hmm15中,该命令还将针对dev数据集输出训练模型的准确性。您可以通过传递文件名来指定用于记录脚本的输出文件:

./start-htk.sh cmd.log