暂无评论
文本网络表示研究与应用,刘建毅,王菁华,文本表示是文本信息处理的基础问题,目前常用的文本表示模型没有考虑文本中词汇间的关系,在表示文本时损失了大量的文本结构信息
对文本分类技术进行研究,介绍文本分类的基本过程,论述文本特征提取方法,讨论朴素贝叶斯、K-近邻、支持向量机、投票等常用的文本分类原理与方法,探讨中文文本分类技术。
介绍了XML文本自动摘要的研究现状,对现存的XML文本自动文摘技术进行了分析和评估,论述了目前该研究方向上尚未解决的一些问题和未来的发展趋势。
新文本去重方法研究,聂洋,,本文通过引入通常见于英文领域的LCS方法来计算近似文本相似度进行去重。文章主要通过分析随机抽取的网页数据文件,对比常用的VSM去
研究了文本挖掘精确度问题。针对传统的聚类文本分类算法在文本分类中存在高维性和稀疏性,特别是同义词和近义词难以进行分类,使得分类的精确度低等问题,提出了一种聚类平均信息量文本分类算法。算法从信息论观点分
若想从文本中获得高质量信息,一般来讲需要处理大量数据集,还需使用自然语言处理方法及参数估计统计模型。针对该问题,首先针对数据遵守幂律分布的统计参数估计模型进行了优化;然后提出一种统计学方法用于文本挖掘
为了提高文本自动分类准确率,提出一种改进的蜂群优化神经网络的选择特征的文本数据挖掘算法。该算法将文本特征选择转换成一个多目标优化问题,以特征维数最少、分类正确率最高为选择标准,采用蚁群算法找到最优特征
EAI平台技术选择研究,荀丽辉,马媛媛,伴随信息化社会的发展,企业信息化问题日益突出。旧系统与新系统的整合、集成,企业内部各个部门之间信息的共享,企业间信息系统
Saas平台软件交付模式将应用软件以服务的形式提供给客户,可缩减硬件采购、系统管理上的开销。由于租户数据统一存储于服务提供商处,如何在维持较高资源利用率的同时保障租户的数据安全是一个挑战性问题。针对租
软件资源信息挖掘在软件动态进化中的应用,刘俊,,本文引入了软件资源信息挖掘的概念,对其进行理论分析,并以应用于软件动态进化为目的对Java应用软件进行资源信息挖掘。本文以基��
暂无评论