Java中的关键字提取 服务器化关键字提取算法的实现,包括TextRank,TF-IDF,TextRank和TFTF-IDF。切割词和过滤停用词均依赖 该存储库主要包括三个部分: 1.算法:用于服务器执行关键词提取的算法,包括TextRank,TF-IDF以及TextRank和TF-IDF的组合 2.评估:评估算法结果的方法,目前只有F1分数可用 3.Parse Documents :提供的方法来读取用于测试的语料库的内容 更多细节可以在找到 1.算法 1.1 TextRank 源文件: TexkRank.java 以文档的标题和内容为输入,返回文档的5个关键字。 String ti