1、对微博数据进行信息采集。 2、对微博数据进行文本特征项抽取。 3、对文本进行向量化。 4、采取相似度公式进行相似度计算和对比。 5、采用K均值聚类算法进行聚类。 6、结合导致微博热点话题产生的各个因素提出了一个用来计算话题热度的公式,进行热度评估。