LRS3 For Speech Separation:LRS3数据集上的多模式语音分离任务数据生成脚本 源码
生成数据的指令 以下是生成训练和测试数据的步骤。 有几个参数可以更改以匹配不同的目的。 我们将尽快在LRS3数据集上发布语音分离基准。 我们的脚本存储库是为了使多模式语音分离任务在数据集生成方面具有统一的标准。 这样我们就可以跟进多模式语音分离任务。 我们希望LRS3数据集将为诸如WSJ0数据集之类的纯语音分离任务制定统一的生成标准。 :check_box_with_check: 我们的基准模型即将推出! 信噪比 信噪比 基准线 15.08 15.34 要求 ffmpeg 4.2.1 袜14.4.2 numpy的1.17.2 OpenCVPython的4.1.2.30 librosa 0.7.0 dlib 19.19.0 face_recognition 1.3.0 第1步-获取原始数据 在这种方法中,我们使用“数据集作为我们的训练,验证和测试集。 Afouras T,Chung JS,Senior
文件列表
LRS3-For-Speech-Separation-master.zip
(预估有个27文件)
LRS3-For-Speech-Separation-master
video_process
.ipynb_checkpoints
check_mouth-checkpoint.py
434B
video-checkpoint.log
30B
video_to_np-checkpoint.py
3KB
video_path-checkpoint.txt
1.23MB
video_process-checkpoint.py
6KB
video_to_np.py
3KB
video_process.py
6KB
暂无评论