will6297的所有下载-用户-卡了网

Speaker Representation Learning using Global Context Guided Channel and Time_Fre

在这项研究中，我们提出了全局上下文指导的通道和时频转换，以对说话人表示中的远程，非本地时频依赖性和通道方差建模。我们使用全局上下文信息来增强重要渠道，并通过计算全局上下文和局部特征之间的相似性来重新校准显着的时频位置。.. 在VoxCeleb1数据集上评估了建议的模块以及基于ResNet的流行模型，