现有的模糊聚类算法(FCM)对初始中心点敏感。 简单的距离聚类既不能准确地发现网络上的热门话题,也不能解决中文的语义多样性问题。 针对这些问题,提出了一种基于动态自适应步萤火虫算法的改进的模糊聚类方法。 通过改进的FA优化了聚类中心,并使用FCM完成了最终的聚类。 首先,在当前迭代中自适应调整步长,并根据文本相似性建立萤火虫之间的关系,然后将主题影响值应用于模糊聚类算法以提高适应度函数优化。 在此过程中,将主题归类为最接近聚类中心的类,这可以减少主题变体的影响。 最后,根据影响力的高低得出了热门话题。 通过从新浪微博收集真实数据,实验验证了该算法的有效性,极大地提高了主题发现的准确性。