基于文档内部信息,利用文档的词聚类算法构建文档主题,进行关键词抽取。基于文档外部信息,利用隐含主题模型构建文档主题,进行关键词抽取。综合利用隐含主题模型和文档结构信息,进行关键词抽取。基于文档与关键词主题一致性的前提,提出基于机器翻译模型的关键词抽取方法。