Familia:工业主题建模工具包 源码
Familia开源项目包含文档主题文档,语义匹配计算工具以及基于工业级语料训练的主题模型:Latent Dirichlet Allocation(LDA),SentenceLDA和Topical Word Embedding(TWE)。支持用户以“拿来即用”的方式进行文本分类,文本聚类,个性化推荐等多种场景的研究和应用。考虑到主题模型训练成本以及开源主题模型资源有限的现状,我们会陆续开放基于工业级语料训练的多()一个垂直领域的主题模型,以及这些模型在工业界的典型应用方式,助力主题模型技术的科研和落地。 新闻!!! 近期,我们在 1.8版本中上线了Familia中的LDA模型,根据数据集的不同,
文件列表
Familia-master.zip
(预估有个85文件)
Familia-master
run_inference_demo.sh
175B
build.sh
68B
.dockerignore
36B
proto
config.proto
751B
AUTHORS
423B
depends.mk
1KB
src
document.cpp
3KB
暂无评论