BembaSpeech:这是本巴语言的ASR语料库。 它包含本巴文学的朗读演讲。 语料库有14 438项话语最终经过24小时的演讲 源码
BembaSpeech ASR语料库 介绍 BembaSpeech是基于公开发行的Bemba文学书籍的赞比亚Bemba语言阅读语音的语料库。 其目的是使能够使用本巴语言对自动语音识别(ASR)系统进行培训和测试。 语料库有14 438条话语,最终达到24.5小时的语音数据。 所有信号文件均以16K Hz的采样率从单声道录制以波形音频文件格式(WAVE)进行编码。 结构体 语料库分为三个部分: -大约20个小时的演讲时间 -大约2.5个小时的演讲时间 -测试装置,大约2个小时的演讲时间 这些子集是不相交的,即,每个扬声器的音频被精确分配给一个子集。 每个演讲者贡献的分配如下: _____________________________________________________________________________________________ | NAME | D
文件列表
BembaSpeech:这是本巴语言的ASR语料库。 它包含本巴文学的朗读演讲。 语料库有14 438项话语,最终经过24小时的演讲
(预估有个15141文件)
Datasheet for BembaSpeech
1B
README.md
4KB
DATASTATEMENT.md
3KB
03-201007-015856_bem_798_elicit_transcripts.txt
7KB
03-200925-050356_bem_798_elicit_transcripts.txt
6KB
03-200925-062606_bem_798_elicit_transcripts.txt
7KB
03-200921-105818_bem_798_elicit_transcripts.txt
7KB
03-200925-003120_bem_798_elicit_transcripts.txt
7KB
01-180101-044203_bem_d31_elicit_transcripts.txt
7KB
01-201005-222019_bem_fb0_elicit_transcripts.txt
7KB
暂无评论