计算句子的相似度在机器问答、机器翻译、文本分类等系统中有着非常重要的作用。该文对基于相同关键词的句子相似模型作了进一步的改进,包括关键词抽取,以及在句子相似度的定义中引入同义词以及近义词的情形。并以此
为了提高受随机值脉冲噪声污染的图像的滤波效果,提出了一种新的滤波算法。对噪声图像进行初步滤波,分辨出图像中比较明显的噪声;根据图像局部像素点的相似性和噪声点的孤立性,计算出噪声图像的相关矩阵;运用模糊
HDSNN—基于节点优先级的聚类算法,张业嘉诚,,聚类算法是数据挖掘领域的重要研究课题。设计能够处理高维,不同形状,密度分布不均匀的数据集的聚类算法成为目前的研究热点。HDS
首先提出旅行商问题(TSP),并将其转化为最短有向图哈密尔顿回路问题,然后介绍了三种类型的求解TSP的算法。第一种为传统算法,包括分支定界法、改良回路法、贪婪算法、MST算法、MM算法、插入法等;第二
K-medoids算法作为聚类算法的一种,不易受极端数据的影响,适应性广泛,但是K-medoids聚类算法的精确度不稳定,平均准确率较低,用于实际的聚类分析时效果较差。ACO是一种仿生优化算法,其具有
谱聚类算法是基于谱图划分理论的一种机器学习算法,它能在任意形状的样本空间上聚类且收敛于全局最优解。但是传统的谱聚类算法很难正确发现密度相差比较大的簇,参数的选取要靠多次实验和个人经验。结合半监督聚类的
针对标准遗传算法的未成熟收敛问题和局部收敛能力不佳等情况,提出一种基于复合形法的聚类遗传算法。通过使用复合形法结合聚类小生境技术对传统的遗传算法进行改进,得到基于复合形法的自适应聚类遗传算法(NCGA
为了改善单一聚类算法的聚类性能, 提出一种基于量子遗传算法的XML文档聚类集成解决方法。该方法首先利用KNN分类算法将XML文档划分成k个差异性的聚类成员; 其次根据聚类成员的关系获得内联相似度矩阵,
评分矩阵(rating matrix)的特点是高维、稀疏、低秩,对其研究的主要方法是低秩矩阵恢复。对这些算法而言,不同评分矩阵的秩,会得到不同的恢复精度。但目前没有理论来研究评分矩阵秩的估计,从而影响
为了解决相交网格划分技术中聚类结果对数据输入顺序的依赖性和聚类结果精度不高的问题,提出了一种基于相交划分的动态网格聚类算法(DGBO)。该算法利用相交网格划分技术和移动网格技术来解决上述问题,通过连接