image
a61121

这家伙很懒,什么也没写

Ta上传的资源(0)个

了解FastSpeech2语音合成的全新突破

FastSpeech2是一种高效的语音合成技术,它能够快速生成自然流畅的语音。该技术基于端对端的框架,使用Transformer架构来生成先进的声音。FastSpeech2的优势在于具有大规模训练的能力,因此能够保证对各种不同的语音转换任务都具有很好的表现。除此之外,FastSpeech2还能自适应

深度学习 7 0 zip 2023-03-17 13:03:44

使用Vocoder技术改写音频

在音频处理领域,Vocoder技术被广泛应用。它能够将语音信号转化为不同的音调、音色或者语气,同时也可以将音乐声音进行重构和变换。 具体来说,Vocoder技术的核心在于分析音频信号的特征,并将其转换为一组参数。然后,这些参数可以被用来合成新的音频信号。在这个过程中,使用的算法包括FFT、滤波器等。

C 4 0 zip 2023-03-11 09:03:14

pinnuodsdsdsdsd

sdsdsdssdsdsdsd

深度学习 2 0 rar 2023-02-08 07:02:17

CASIA汉语情感语料库.rar

中科院自动化所录制的情感语料库,数据库包括奖金10000条语音。发音为中文数据库包括angry、fear、happy、neutral、sad和surprise六种情绪,四个演员对300句相同文本和100句不同文木进行朗诵。收集的语音信号基本是纯净无噪声的,以16000khz采样率,16bit,pcm

机器学习 23 0 RAR 2020-05-04 04:05:17