自然语言关键词提取
关键词提取就是从文本里面把跟这篇文章意义最相关的一些词语抽取出来,在文献检索、自动文摘、文本聚类/分类等方面有着重要的应用。 关键词提取算法一般分为有监督和无监督两类 有监督的关键词提取方法主要是通过分类的方式进行,通过构建一个较为丰富和完善的词表,然后判断每个文档与词表中每个词的匹配程度,以类似打标签的方式,达到关键词提取的效果。优点是精度较高,缺点是需要大批量的标注数据,人工成本过高,并且词表需要及时维护。 相比较而言,无监督的方法对数据的要求低,既不需要一张人工生成,维护的词表,也不需要人工标注语料辅助训练。目前比较常用的关键词提取算法都是基于无监督算法。如TF-IDF算法,TextRa
用户评论
推荐下载
-
自然语言处理中的关键词提取技术
关于自然语言处理中的关键词提取技术,词图模型涌现了两个重要的算法,即PageRank和TextRank。1997年,Google创始人拉里·佩奇和谢尔盖·布林构建早期搜索系统时提出了PageRank算
62 2023-11-26 -
小说关键词提取新闻关键词提取
小说关键词提取新闻关键词提取
50 2020-08-14 -
关键词提取
关键词提取,基于生成模型的方法,自动“抽取”生成一些字面上未出现的词条
55 2019-02-10 -
TFIDF关键词提取
利用java实现TFIDF,提取关键词,是术语提取、推荐系统等应用的基础之一。
68 2018-12-17 -
自然语言处理_关键词提取四种方法_实验一源码加数据
有源码及数据集,资源描述:基于TextRank、TF-IDF、LSI、LDA模型的关键词提取,实验数据为人民网的新闻,计算不同模型提取出的关键字的相似度
10 2019-07-09 -
淘宝关键词批量生成加关键词提取
淘宝关直通车关键词提取,关键词批量生成工具,非要好用的组合,找关键词变的如此简单
114 2019-06-04 -
php关键词提取加关键词库
一个不错的PHP关键词自动提取工具,附加关键词库。
101 2019-05-16 -
提取关键词Java版
Java编写的提取一篇文章中的关键词的程序,可以运行
52 2018-12-28 -
关键词提取方法.py
自然语言处理,关键词提取,机器学习,人工智能,深度学习
17 2020-08-14 -
根据关键词提取文本
在网上查找了许久找到的可用的代码,MFC界面编程,实现在原文件夹中提取与关键词相关的文本,并存储于另一文件夹。
26 2020-05-13
暂无评论