研究前沿是科学前沿的重点,指导着科学发展的方向。 及时,准确地掌握研究前沿对国家,机构和研究人员具有重要意义。 本文基于LDA模型,使用Python语言对2013年至2017年的国外人工智能数据进行标准化处理,停用词去除,词干提取和词形恢复。处理后的数据导入LDA模型输出主题词表和文档-主题矩阵。 在主题-词汇矩阵的基础上描述主题,并根据文档主题矩阵和构造的边界识别指标计算出研究前沿,从而获得国外人工智能的研究前沿。包括三类:计算机视觉研究,人工智能在各个领域的应用以及数据挖掘和聚类研究。