基于【谭松波ChnSentiCorp-Htl-ba-4000:平衡语料,正负类各2000篇】的【改良版】语料库。原语料库夹杂着许多重复评论、垃圾评论,以及被错误分类的评论,影响分类模型的评价指数。本语料库4000评论都已经过人工整理,耗时三天,用作训练集获得的模型质量更高。