截取了内容的一部分:M“/想要/成为/一名/伟大/的/战士/,/就/必须/从小/刻苦/锻炼/。/”/EM“/你们/都/是/普通人/,/不/可能/像/那些/大/贵族/一样/有/厉害/的/斗/气密/典/修
机器人对话语料库,苦苦收集而来,希望可以帮助大家,谢谢支持
这个语料库大概有上万条对话,都是中文的,免费分享给大家。缺点是使用的语法都是最基本的语法,没有一些华丽的对话设置。
语料库工具 分词器,清理器,分析器,模糊匹配器,TfIdf,Eval,POS-tagger 令牌器(OpenNMT): pip install pyonmttok echo "Hello W
藏语语料库预处理研究
TED平行语料库是一个多语言平行语料库,包括多语言并行语料库和单语语料库。该语料库从TED会议中提取了109种世界语言的文本数据。多语言的平行语料库包括12种语言,涵盖了超过1.2亿个对齐句子,并且这
LibriVox语料库下载链接,可以用于语种识别,每个语种100+ hours的语料库,包含以下语种的(english、French、German、spanish、Italian、Dutch)六种语言
本文介绍了银行疑问句(BQ)语料库,这是一种用于句子语义对等识别(SSEI)的中文语料库。 BQ语料库包含来自1年在线银行客户服务日志的120,000个问题对。 为了有效地处理和注释来自如此大量日志的
NLP文本分类语料库(复旦)语料训练集
spacy语料库英文版3.0.0