为提升传统LDA 模型的主题识别性能, 并给主题最优数目选择提供技术方案, 提出基于自适应聚类的K-wrLDA 模型。利用LDA 和Word2Vec 模型得出包含主题词概率信息及词义相关性的T-WV 矩 阵, 并将传统LDA 模型的主题数目选择问题转化为聚类效果评价问题, 以内部指标F 统计量作为目标函数,计算主题聚类数目的最优解, 并对新旧两种模型的主题识别效果进行比较。