暂无评论
这个语料库大概有上万条对话,都是中文的,免费分享给大家。缺点是使用的语法都是最基本的语法,没有一些华丽的对话设置。
Concapp 由香港理工大学虚拟语言学习中心发布,是一款针对语料库的检索软件,主要支持英语语料的处理,汉语和日语语料的处理不够理想。 Concapp 在英文科技论文写作中,可以帮助我们了解其他文献(
TED平行语料库是一个多语言平行语料库,包括多语言并行语料库和单语语料库。该语料库从TED会议中提取了109种世界语言的文本数据。多语言的平行语料库包括12种语言,涵盖了超过1.2亿个对齐句子,并且这
大概一万句中英对齐语料库,不用预处理了直接可以用.!!
该ppt为中文分析算法的语料库和词典结构简介
LibriVox语料库下载链接,可以用于语种识别,每个语种100+ hours的语料库,包含以下语种的(english、French、German、spanish、Italian、Dutch)六种语言
藏语语料库预处理研究
23个在线英语词典和英语语料库。大家可以拿来训练模型。
本文介绍了银行疑问句(BQ)语料库,这是一种用于句子语义对等识别(SSEI)的中文语料库。 BQ语料库包含来自1年在线银行客户服务日志的120,000个问题对。 为了有效地处理和注释来自如此大量日志的
NLP文本分类语料库(复旦)语料训练集
暂无评论