百度开源项目Familia Familia 开源项目包含基于工业语料库训练的文档主题推理工具、语义匹配计算工具和三个主题模型: latentyal letallocation (LDA) 、 SentenceLDA 和支持用户以 “想用就用” 的形式进行文本分类、文本聚类、个性化推荐等场景的研究和应用。考虑到主题模型的训练成本