实时语音克隆:在5秒内克隆语音以实时生成任意语音 源码
实时语音克隆 该存储库是使用实时工作的声码器实现的(SV2TTS)的实现。 如果您好奇或正在寻找我未记录的信息,请随时检查。 通常,我建议您快速浏览一下引言之外的数字。 SV2TTS是一个三阶段的深度学习框架,它允许从几秒钟的音频中创建语音的数字表示,并使用它来调节经过训练的文本到语音模型,以推广到新的语音。 视频演示(单击图片): 已实施文件 网址 指定 标题 实施源 SV2TTS 将学习从演讲者验证转移到多演讲者语音合成 这个回购 WaveRNN(声码器) 高效的神经音频合成 Tacotron 2(合成器) 基于梅尔谱图预测的条件波网自然合成TTS GE2E(编码器)
文件列表
Real-Time-Voice-Cloning-master.zip
(预估有个84文件)
Real-Time-Voice-Cloning-master
.gitignore
206B
README.md
5KB
utils
modelutils.py
698B
logmmse.py
9KB
__init__.py
0B
profiler.py
1KB
argutils.py
1KB
demo_cli.py
10KB
暂无评论