本数据集是用于文本聚类的中文文本数据,数据集不大属于小型数据集,代码实现可参考本人的博客