声乐提取器 U-Net语音提取架构的实现 关于: Jansson等人的论文。 [1]实现了一个U-Net卷积神经网络来尝试提取歌声。该存储库旨在从头开始重建代码,以更好地理解实现深度学习与音乐交汇处的任务所必需的工具。 笔记: 我还没有为人类可解释的结果构建接口。完成后,将使用显示结果以供人们收听的体系结构构建一个简单的Web应用程序。 有关数据的信息: 用于训练模型的数据集为DSD100 [2]。其中包含100首歌曲(50/50训练/测试),其中混合的歌曲作为输入以及歌曲的四个词干:人声,贝斯,鼓等。对于培训和测试,仅需要混合歌曲及其相应的人声。 探索性数据分析: 为了了解数据集的含义,通过进行阅读应该可以使您很快适应。 使用模式: 要在经过训练的模型上工作,请运行以下命令: import tensorflow as tf unet = tf . keras . models .