中科院分词算法为目前针对中文文本分词效果最佳的算法,为聚类算法提供了良好的数据源