SincNet:SincNet是一种用于有效处理原始音频样本的神经体系结构 源码
SincNet SincNet是用于处理原始音频样本的神经体系结构。 这是一种新颖的卷积神经网络(CNN),它鼓励第一个卷积层发现更多有意义的滤波器。 SincNet基于参数化的Sinc函数,这些函数实现了带通滤波器。 与学习每个滤波器的所有元素的标准CNN相比,所提出的方法只能从数据中直接学习低和高截止频率。 这提供了一种非常紧凑而有效的方式来导出专门针对所需应用进行了调整的定制滤波器组。 该项目发布了一系列代码和实用程序,可通过SincNet进行说话人识别。 使用TIMIT数据库提供了说话人识别的示例。 如果您对应用于语音识别的SincNet感兴趣,可以查看PyTorch-Kaldi
文件列表
SincNet-master.zip
(预估有个16文件)
SincNet-master
cfg
SincNet_Librispeech.cfg
960B
SincNet_TIMIT.cfg
973B
data_lists
TIMIT_labels.npy
124KB
TIMIT_test.scp
36KB
TIMIT_train.scp
58KB
TIMIT_all.scp
94KB
data_io.py
6KB
暂无评论