TTS和VC相关论文 内容 演讲者增强可以改善多演讲者的端到端TTS吗? 于Interspeech,2020年 人工扬声器增强,使用SoX speed命令通过重新采样来加速或减慢音频。 使用低质量数据进行扬声器增强,在后网中添加一个热通道标签,并使编码器依赖于方言编码器网络(基于LDE的网络体系结构)。 骨干:tacotron,声码器:WaveNets 使用扬声器不平衡语音语料库训练多扬声器神经文本语音转换系统。 in Interspeech,2019 重采样技术(多数说话者的欠采样/少数说话者的过采样)被应用到训练中。 相关论文: , , 模型合奏。 定义了基于平均值的组合函数以组合3个子系统的输出(MGC和F0)。 子系统的架构是相同的,但是在训练语料库的不同子集上进行了训练。 10个雌性日本spk * 1k〜10k utt / spk; spk:10维一热向量; 使用