python三阶深度学习框架RealTimeVoiceCloningmaster.zip
Real-TimeVoiceCloning是“TransferLearningfromSpeakerVerificationtoMultispeakerText-To-SpeechSynthesis(SV2TTS)”论文的实现,这是一个三阶深度学习框架,允许从几秒钟的音频中创建一个数字化的语音,并使用它来调节训练的“文本转语音”模型,以推广到新的声音。
文件列表
Real-Time-Voice-Cloning-master.zip
(预估有个76文件)
Real-Time-Voice-Cloning-master
synthesizer
inference.py
6KB
train.py
20KB
utils
text.py
2KB
numbers.py
2KB
__init__.py
444B
_cmudict.py
2KB
cleaners.py
2KB
暂无评论