AdaSpeech:自适应文本到语音的自定义语音[WIP] 非官方Pytorch实施 。 笔记: 我不考虑使用多扬声器的情况,我只专注于单个扬声器。 我将仅使用Utterance level encoder和Phoneme level encoder而不使用条件层规范(这是AdaSpeech论文的灵魂),它定义了AdaSpeech的自适应特性,但我的重点是提高FastSpeech 2声学泛化而非自适应。 引文 @misc { chen2021adaspeech , title = { AdaSpeech: Adaptive Text to Speech for Custom Voice } , author = { Mingjian Chen and Xu Tan and Bohan Li and Yanqing Liu and Tao Qin and Sh