马来语数据集:马来西亚马来语文本语料库https:malaya.readthedocs.ioenlatestDataset.html 源码
马来语数据集,我们收集了马来西亚语料库! 该存储库用于存储和。 我们将不断更新此存储库。 我们如何收集数据集? 对于新闻,文章和字幕,我们使用搜寻器,您可以从此处获取代码 。 对于Bahasa,大多数情况下我们使用Google Translator,您可以从此处获取代码 。 使用社交媒体,我们使用爬虫从Twitter,Facebook和Instagram捕获大多数实时数据,因此我们仅使用Elasticsearch查询进行搜索。 对于语音,我们使用Macbook Air 2013附带的有线麦克风进行录制,同时阅读了bahasa维基百科的一些随机文本。 我们请一些语言学家来监督。
用户评论
推荐下载
-
用于文本分类的语料库
分为10个类大概2000篇多文本,可用于文本分类的语料库
32 2020-01-05 -
文本分类中文语料库
这是一个文本分类的语料库,主要是用于文本分类,主旨句提取,关键词提取等等应用。
45 2019-05-17 -
Brazilian Portuguese Literature Corpus巴西葡萄牙语文学语料库数据集
巴西文学是巴西人用葡萄牙语或或巴西语写的文学,包括1822年巴西独立之前写的作品。在早期,巴西的文学追随葡萄牙的文学潮流,而在19世纪和20世纪的过程中,为了寻找真正的巴西主题和使用葡萄牙语,逐渐转向
10 2021-04-08 -
马来酸型聚羧酸水煤浆分散剂的合成研究
以马来酸酐、聚乙二醇、甲基丙烯酸和苯乙烯磺酸钠为主要原料,通过自由基聚合出一种马来酸型聚羧酸水煤浆分散剂,并将该分散剂用于水煤浆制浆,通过对该分散剂制得的水煤浆的各项性能进行测试与分析,可以看出:该分
19 2020-07-17 -
马来酸噻吗洛尔眼用凝胶的含量测定
建立一种马来酸噻吗洛尔眼用凝胶中噻吗洛尔的含量测定方法。以C18柱为分析柱,以水(1‰三乙胺,用磷酸调节pH值至5.0)-甲醇(60:40)溶液为流动相,检测波长为295 nm,柱温为室温,外标法测定
17 2020-07-17 -
微波辐射下N马来酰氨基酸的快速合成
利用微波辐射法完成顺丁烯二酸酐与苯丙氨酸、异亮氨酸、甘氨酸、丝氨酸、脯氨酸、亮氨酸6种氨基酸的酰化。将氨基酸与酸酐按照1∶1的投料比加入到反应容器中,再加入适当的溶剂,在微波合成仪中进行反应,TLC监
11 2020-07-21 -
青云语料库
自然语言处理语料库,可以用于训练。对话质量较高,噪音相对较少,任然需要做一些处理。
28 2020-05-31 -
语料库tccorpusanswer
作为训练使用的语料库
26 2020-05-14 -
邮件语料库
用于邮件分类的语料库
27 2020-05-18 -
语料库.zip
语料库资源里有网上购酒评论,分为积极评论与消极评论;资源里还包括中文停用词1800+
33 2020-03-06
暂无评论