为了应对短消息特征稀疏性对微博热点话题检测的挑战,本文首先探讨了词之间的关系,然后建立了比词-文档矩阵更密集的词相关矩阵。 术语相关矩阵上的对称非负矩阵分解(SNMF)用于获得术语-主题矩阵。 最后,我们根据术语-主题矩阵将主题学习问题表述为概率潜在语义分析(pLSA)。 此外,本文还介绍了热量的分布和主题排序的机制。 实验表明,该方法可以有效地对话题进行聚类,并应用于微博热点话题的检测。