BembaSpeech:这是本巴语言的ASR语料库。它包含本巴文学的朗读演讲。语料库有14 438项话语最终经过24小时的演讲源码

arrive20209 2 0 ZIP 2021-04-26 11:04:28

BembaSpeech ASR语料库介绍 BembaSpeech是基于公开发行的Bemba文学书籍的赞比亚Bemba语言阅读语音的语料库。其目的是使能够使用本巴语言对自动语音识别(ASR)系统进行培训和测试。语料库有14 438条话语,最终达到24.5小时的语音数据。所有信号文件均以16K Hz的采样率从单声道录制以波形音频文件格式(WAVE)进行编码。结构体语料库分为三个部分: -大约20个小时的演讲时间 -大约2.5个小时的演讲时间 -测试装置,大约2个小时的演讲时间这些子集是不相交的,即,每个扬声器的音频被精确分配给一个子集。每个演讲者贡献的分配如下: _____________________________________________________________________________________________ | NAME | D

文件列表

BembaSpeech:这是本巴语言的ASR语料库。它包含本巴文学的朗读演讲。语料库有14 438项话语，最终经过24小时的演讲 (预估有个15141文件)

Datasheet for BembaSpeech 1B

README.md 4KB

DATASTATEMENT.md 3KB

03-201007-015856_bem_798_elicit_transcripts.txt 7KB

03-200925-050356_bem_798_elicit_transcripts.txt 6KB

03-200925-062606_bem_798_elicit_transcripts.txt 7KB

03-200921-105818_bem_798_elicit_transcripts.txt 7KB

03-200925-003120_bem_798_elicit_transcripts.txt 7KB

01-180101-044203_bem_d31_elicit_transcripts.txt 7KB

01-201005-222019_bem_fb0_elicit_transcripts.txt 7KB

01-201004-205737_bem_fb0_elicit_transcripts.txt 7KB

01-201005-230705_bem_fb0_elicit_transcripts.txt 6KB

01-180101-060018_bem_d31_elicit_transcripts.txt 6KB

01-200918-120021_bem_d31_elicit_transcripts.txt 6KB

01-180101-213930_bem_d31_elicit_transcripts.txt 6KB

01-200918-090125_bem_d31_elicit_transcripts.txt 6KB

01-180101-020137_bem_d31_elicit_transcripts.txt 7KB

01-180101-023548_bem_d31_elicit_transcripts.txt 7KB

01-201005-212422_bem_fb0_elicit_transcripts.txt 6KB

05-200917-085055_bem_a40_elicit_transcripts.txt 7KB

用户评论

暂无评论

手机评论文本语料库

商城手机评论文本，华为荣耀手机（2款手机评论文本），小米红米手机，OPPO手机各1000条，共4000条。可作为中文分类的训练语料库，用于情感分析，推荐系统等领域。最新的评论资源。

28 2019-07-14
语料库通用技术平台INSPIRE

语料库通用技术平台Inspire1主要包括语料采集、语料加工、语料统计和语料检索等四大功能

25 2019-07-29
语料库研究与应用综述

语料库通常指为语言研究收集的、用电子形式保存的语言材料，由自然出现的书面语或口语的样本汇集而成，用来代表特定的语言或语言变体。经过科学选材和标注、具有适当规模的语料库能够反映和记录语言的实际使用情况。

21 2019-07-11
语料库分析工具Antconc下载

让需要的人可以更容易找到吧，只是不知道传的会不会有问题试试。。。。

39 2019-07-11
美国当代英语语料库20000

美国当代英语语料库COCA20000条,试着来挑战一下吧。

54 2019-07-11
文本分类搜狗语料库

搜狗文本分类语料库

28 2019-05-31
语料库WordSmith翻译研究使用

Corpus WordSmith translation research use

20 2019-06-23
机器人语料库.zip

机器人对话语料库，苦苦收集而来，希望可以帮助大家，谢谢支持

99 2019-09-25
AIML aiml中文语料库

这个语料库大概有上万条对话,都是中文的,免费分享给大家。缺点是使用的语法都是最基本的语法,没有一些华丽的对话设置。

196 2021-05-02
TED平行语料库数据集

TED平行语料库是一个多语言平行语料库，包括多语言并行语料库和单语语料库。该语料库从TED会议中提取了109种世界语言的文本数据。多语言的平行语料库包括12种语言，涵盖了超过1.2亿个对齐句子，并且这

0 2024-08-17

BembaSpeech:这是本巴语言的ASR语料库。 它包含本巴文学的朗读演讲。 语料库有14 438项话语最终经过24小时的演讲 源码

文件列表

用户评论

推荐下载

BembaSpeech:这是本巴语言的ASR语料库。它包含本巴文学的朗读演讲。语料库有14 438项话语最终经过24小时的演讲源码