论文研究 基于LDA的条件随机场主题模型研究.pdf

sharon_JIAN 28 0 PDF 2020-07-16 16:07:22

使用主题模型对文本建模,提取文本的隐含主题,进而进行词性标注和文本分类等工作,是机器学习和文本挖掘领域的研究热点。提出一个基于LDA的主题模型,它基于“段袋“假设——文本中的段落具有相同的主题,且连续的段落更倾向于具有相同的主题。对于文章的段落,采用条件随机场(CRF)模型划分并判断它们是否具有相同主题。实验表明,新模型相比LDA模型能更好得提取主题并具有更低的困惑度,同时,能够较好地进行词性标注和文本分类工作。

论文研究 基于LDA的条件随机场主题模型研究.pdf

用户评论
请输入评论内容
评分:
暂无评论