文本特征选择是文本分类的核心技术。针对信息增益模型的不足之处,以特征项的频数在文本中不同层面的分布为依据,分别从特征项基于文本的类内分布、基于词频的类内分布以及词频的类间分布等角度对IG模型逐步进行改
基于网页分析的Blog文本抽取,杜磊,,随着互联网的快速发展,简单的HTML不能满足人们对页面设计越来越高、越来越复杂的要求,网站的界面设计正在变得日趋复杂,页面中��
研究了一种基于核的最大散度差准则的文本特征抽取方法。首先回顾了文本分类中特征降维的主要方法、Fisher准则及其相关研究进展以及存在的问题;然后分析了基于散度差准则的线性鉴别方法的优点与不足,借助于核
基于依存的蕴含关系研究,张子宪,,蕴含关系(Entailment)是语言中的同义异形现象,如果文本T可以推断出假设H(T→H),则它们之间存在蕴含关系。本文从英语句子中轻动词结构
将信息论中熵的概念应用到特征选择中,定义了两种信息测度评价特征——误差熵和混叠熵,然后阐述了两种定义的不用物理意义,分析了计算熵中最关键的区间划分问题,并提出一种较好的区间划分方法。由于熵不能将相似的
为了提高网络入侵检测的正确率,提出一种基于KNN-IPSO选择特征的网络入侵检测模型(KNN-IPSO)。首先采用K近邻算法消除原始网络数据中的冗余特征,并将其作为粒子群算法的初始解,然后采用粒子群算
面向图像分类的特征选择方法,于风格,黄雅平,随着互联网、多媒体技术和计算机视觉的快速发展,海量的数字图像的处理成为日益现实而紧迫的问题,即如何从如此纷繁复杂的图像中
为了提高目标跟踪过程中粒子滤波结果的精度,将边缘粒子滤波算法应用于目标跟踪。首先将目标运动状态向量划分为线性和非线性两个子向量,然后,采用卡尔曼滤波方法处理线性状态子向量,采用粒子滤波方法处理非线性状
有三个文件,1.经济方面的实体关系数据集2.几篇中文实体论文3.SemEval2010_任务8_实体关系抽取数据集
虚拟化系统的强隔离性质在为安全机制部署提供可靠环境的同时,也引入了语义鸿沟问题。针对现有研究普遍依赖的软件体系结构信息、数据结构和控制流容易被窜改,采用的检测算法在客户机状态识别方面效率较低等问题,设