基于LDA的TopicModel,能够处理中文,获取用户对不同主题的兴趣分布。 LDA及其并行化在海量数据分析中的应用越来越广。 数据格式: #*微博标题 #@weibo作者 #!分好词的微博内容(可用FudanNLP进行分析和标注词性) #t时间 #%引用\转发\回复关系 #end结束符