规格 这是SpecAugment的一种实现,该语音数据增强方法可直接使用Tensorflow&Pytorch处理频谱图,这是Google Brain提出的[1]。 当前在Apache 2.0中使用,请随时用于您的项目。 请享用! 如何使用 首先,您需要与一起安装python 3。 接下来,您需要安装一些音频库才能正常工作。 安装需求包。 运行以下命令: pip3 install SpecAugment 然后,运行specAugment.py程序。 它通过在时间方向上扭曲频谱图,掩盖连续频道的块以及掩盖时间上的话语来修改频谱图。 尝试您的音频文件SpecAugment $ python