WavAugment WavAugment对音频数据执行数据增强。音频数据表示为张量。 对于语音数据特别有用。除其他外,它实现了我们发现对自我监督学习最有用的增强(时域语音表示的数据增强对比学习,E.Kharitonov,M.Riviere,G.Synnaeve,L.Wolf,P。 -E。Mazaré,M。Douze,E。Dupoux。 ): 音高随机化 混响, 加性噪声 时间丢失(时间掩蔽), 带拒绝 剪裁 在内部,WavAugment使用并允许基于libsox和pytorch的效果交错。 要求 Linux或MacOS > = 1.7 >> 0.7 安装 要安装WavAugment,请运行以下命令: git clone git@github.com:facebookresearch/WavAugment.git && cd WavAugment && python setup.py