酒店评论语料UTF810000条
现在网上大部分谭老师的评论语料资源的编码方式都是gb2312,本资源除了原始编码格式,还具有UTF-8编码格式。
本资源还包含将所有语料分成pos.txt和neg.txt两个文件,每个文件中的一行代表原始数据的一个txt文件,即一篇评论
用户评论
推荐下载
-
哈工大语料
哈尔冰工业大学语料,需要的下载,HIT-CDTB-1.0
59 2019-02-15 -
python语料收集
使用前微信关注小冰,与腾讯智能闲聊互问,用于收集生成式训练语料,语料质量还行吧
27 2019-03-14 -
新闻分类语料
新闻分类语料,9个类别财经,教育,军事,科技,政治等按新闻标签爬取的。
44 2019-05-17 -
分词训练语料
用于深度学习NLP分词训练,训练模式BEMS,已经标注好,可直接使用
30 2019-05-21 -
泰语的语料
用于分词、句法分析的泰语语料,主要适用于自然语言处理的学习之用!
22 2019-04-16 -
python语料爬虫
做自然语言处理时需要语料来做训练集,利用这个爬虫程序可以很方便的获取语料。
36 2019-05-16 -
中英平行语料
UNparallelcorpus.15,886,041linescasia2015:1,050,000linescasict2015:2,036,833linesdatum2015:1,000,003
26 2019-07-08 -
语料预处理
对获得到的语料数据进行预处理,其中语料数据的原始形式为{"title":"xxxxxxxx","content":"xxxxxxxxxxxxxx"}.
22 2019-04-30 -
关系抽取语料
nlp-tutorial-master.zip 是关于医学的关系抽取语料。
41 2019-03-28 -
aiml中文语料
aiml,中文语料库,从别的地方收集的,提供大家学习用
82 2019-04-28
暂无评论