基于向量空间模型的文本聚类算法 姚清耘,刘功申,李 翔 (上海交通大学信息安全工程学院,上海 200240 摘 要:文本聚类是聚类的一个重要研究分支,是聚类方法在文本处理领域的应用该文探讨了基于向量空间模型的文本聚类方法,提出了一种文本聚类的改进算法LP 算法同时,基于语料库的实际聚类效果,就维度确定特征选择等方面提出优化方案实验证明,LP 算法有效地减少了聚类所消耗的时间,实用性和灵活性都较高