WAVEGLOW摘要1 引言2 WAVEGLOW2.1 放射耦合层2.2 1*1可逆卷积2.3 早期产出2.4 推论3 实验记录 摘要 在本文提出了WaveGlow:一种依靠流的从梅尔频谱图合成高质量语音的网络。它结合了Glow和WaveNet,生成的快、好、高质量的韵律,而且还不需要自动回归。实现也只是一个单网络,仅使用单个成本函数进行训练:最大化训练数据的可能性,这使训练过程简单且稳定。我们的用了PyTorch实现,结果也蛮好的,和最佳公开的WaveNet效果相同。 1 引言 随着与机器的语音交互变得越来越有用,有效合成高质量语音变得越来越重要。语音质量或延迟的微小变化会对客户体验和客户偏