a61121
这家伙很懒,什么也没写
了解FastSpeech2语音合成的全新突破
FastSpeech2是一种高效的语音合成技术,它能够快速生成自然流畅的语音。该技术基于端对端的框架,使用Transformer架构来生成先进的声音。FastSpeech2的优势在于具有大规模训练的能力,因此能够保证对各种不同的语音转换任务都具有很好的表现。除此之外,FastSpeech2还能自适应
深度学习 7 0 zip 2023-03-17 13:03:44
使用Vocoder技术改写音频
在音频处理领域,Vocoder技术被广泛应用。它能够将语音信号转化为不同的音调、音色或者语气,同时也可以将音乐声音进行重构和变换。 具体来说,Vocoder技术的核心在于分析音频信号的特征,并将其转换为一组参数。然后,这些参数可以被用来合成新的音频信号。在这个过程中,使用的算法包括FFT、滤波器等。
C 4 0 zip 2023-03-11 09:03:14
CASIA汉语情感语料库.rar
中科院自动化所录制的情感语料库,数据库包括奖金10000条语音。发音为中文数据库包括angry、fear、happy、neutral、sad和surprise六种情绪,四个演员对300句相同文本和100句不同文木进行朗诵。收集的语音信号基本是纯净无噪声的,以16000khz采样率,16bit,pcm
机器学习 23 0 RAR 2020-05-04 04:05:17