论文研究基于特征选择的实体关系抽取.pdf

宛陵秋 26 0 PDF 2020-07-19 03:07:24

提出了一种实体关系抽取方案，该方案针对实体关系抽取中特征空间维数过高问题，引入了文本分类中的特征选择算法，如信息增益、期望交叉熵和x2统计，实现了特征空间降维。实验结果表明，各特征选择算法均能在尽量保证抽取性能的同时有效地降低向量空间维数，提高分类效率，其中x2统计取得的效果最好。

推荐下载

文本特征选择是文本分类的核心技术。针对信息增益模型的不足之处,以特征项的频数在文本中不同层面的分布为依据,分别从特征项基于文本的类内分布、基于词频的类内分布以及词频的类间分布等角度对IG模型逐步进行改

基于网页分析的Blog文本抽取,杜磊,,随着互联网的快速发展,简单的HTML不能满足人们对页面设计越来越高、越来越复杂的要求,网站的界面设计正在变得日趋复杂,页面中��

研究了一种基于核的最大散度差准则的文本特征抽取方法。首先回顾了文本分类中特征降维的主要方法、Fisher准则及其相关研究进展以及存在的问题；然后分析了基于散度差准则的线性鉴别方法的优点与不足,借助于核

基于依存的蕴含关系研究,张子宪,,蕴含关系(Entailment)是语言中的同义异形现象,如果文本T可以推断出假设H(T→H),则它们之间存在蕴含关系。本文从英语句子中轻动词结构

将信息论中熵的概念应用到特征选择中,定义了两种信息测度评价特征——误差熵和混叠熵,然后阐述了两种定义的不用物理意义,分析了计算熵中最关键的区间划分问题,并提出一种较好的区间划分方法。由于熵不能将相似的

为了提高网络入侵检测的正确率,提出一种基于KNN-IPSO选择特征的网络入侵检测模型(KNN-IPSO)。首先采用K近邻算法消除原始网络数据中的冗余特征,并将其作为粒子群算法的初始解,然后采用粒子群算

面向图像分类的特征选择方法,于风格,黄雅平,随着互联网、多媒体技术和计算机视觉的快速发展,海量的数字图像的处理成为日益现实而紧迫的问题,即如何从如此纷繁复杂的图像中

为了提高目标跟踪过程中粒子滤波结果的精度,将边缘粒子滤波算法应用于目标跟踪。首先将目标运动状态向量划分为线性和非线性两个子向量,然后,采用卡尔曼滤波方法处理线性状态子向量,采用粒子滤波方法处理非线性状

有三个文件,1.经济方面的实体关系数据集2.几篇中文实体论文3.SemEval2010_任务8_实体关系抽取数据集

虚拟化系统的强隔离性质在为安全机制部署提供可靠环境的同时,也引入了语义鸿沟问题。针对现有研究普遍依赖的软件体系结构信息、数据结构和控制流容易被窜改,采用的检测算法在客户机状态识别方面效率较低等问题,设

用户评论

请输入评论内容

评分：

暂无评论

论文研究 基于特征选择的实体关系抽取.pdf