暂无评论
关于酒店的评论,很好的情感分析语料,有4个不同的分类,每类超过2000篇
中国教育和研究计算机紧急响应垃圾邮件语料库
以论文摘要为主的20000+条语料,包含多个学科分类的内容,内容丰富,可做自然语言处理初学者日常学习之用。
语料库中文中文语料库复旦大学
可用于情绪语音识别,中文语料库
文本分类语料库,中文,训练集和测试集
相对比较完整的中文语料库,用于中文本分类的训练预料
搜狗语料库,自己用结巴分词分好的。(为什么摘要必须大于50个字)
语言所公开的现代汉语语料库,通过分别查询3500个常用汉字,将所有数据进行清洗去重后的集合。共554026行,解压后约93.8M,带分词和词性标注。
电子邮件语料库,内含多篇中文电子邮件文本以及收发信息
暂无评论