SpecAugment:由Tensorflow和Pytorch实现的SpecAugment由Google Brain介绍 源码
规格 这是SpecAugment的一种实现,该语音数据增强方法可直接使用Tensorflow&Pytorch处理频谱图,这是Google Brain提出的[1]。 当前在Apache 2.0中使用,请随时用于您的项目。 请享用! 如何使用 首先,您需要与一起安装python 3。 接下来,您需要安装一些音频库才能正常工作。 安装需求包。 运行以下命令: pip3 install SpecAugment 然后,运行specAugment.py程序。 它通过在时间方向上扭曲频谱图,掩盖连续频道的块以及掩盖时间上的话语来修改频谱图。 尝试您的音频文件SpecAugment $ python
文件列表
SpecAugment-master.zip
(预估有个16文件)
SpecAugment-master
images
Figure_1.png
78KB
Figure_2.png
66KB
requirements.txt
24B
SpecAugment
sparse_image_warp_np.py
7KB
__init__.py
0B
sparse_image_warp_pytorch.py
16KB
spec_augment_pytorch.py
5KB
暂无评论