针对当前互联网网页越来越多样化、复杂化的特点,提出一种基于结构相似网页聚类的网页正文提取算法,首先,根据组成网页前端模板各“块”对模板的贡献赋以不同的权重,其次计算两个网页中对应块的相似度,将各块的相
ART2(自适应谐振理论2)算法是神经网络中一种可以对模拟输入信号或二值信号进行无监督聚类的算法,所以ART2算法能够降低数据挖掘中原始数据的预处理的复杂度,提高挖掘效率。针对ART2算法中出现的聚类
由Jeh和Widom提出的SimRank算法是一种普适"结构相似度"计算模型。由于SimRank算法采用迭代方式计算图节点间相似性,因此时间复杂度和空间复杂度都非常高。随着数据量的
高光谱图像具有较高谱分辨率的优越性是以其较大的数据量及较高的数据维为代价的,因此有必要研究有效的高光谱图像压缩方法。探讨一种基于谱间预测的高光谱图像压缩方案。考虑到高光谱图像谱间相关性随分辨率的提高而
凝聚层次聚类算法的改进,张宏,李欣欣,凝聚型层次聚类算法是一个非常有用的聚类算法,它在迭代地凝聚每次接近对直到所有的数据都属于同一个簇。但层次聚类也存在缺点,如�
提出了基于K-means的四叉树与R-link树的混合结构树,提高了R-link树的查询性能,在K-means中采用均值—标准差确定初始聚类中心,提高了收敛速度,通过距离准则函数来优化K值,避免K值的
在分析AVS-M帧内预测模式选择原理的基础上,提出了一种基于边缘方向信息和时空相关性的帧内预测模式快速选择算法。该算法的I帧编码时间可降低17%~21%,而PSNR和输出码率均无明显变化,有效地降低A
关系数据可抽象为网络,在通常情况下,缺乏对这些现实网络背景知识的了解。为了评价图聚类算法在现实网络上的性能表现,构建了一种接近现实的网络模型,通过算法在模型网络上的性能表现来推断其分析现实网络的能力。
第35卷第1期 计算机应用研究 V0135No1 2018年1月 Researchof Jan2018 Application Computers 基于MapReduce计算模型的并行 关联规则挖掘算
计算句子的相似度在机器问答、机器翻译、文本分类等系统中有着非常重要的作用。该文对基于相同关键词的句子相似模型作了进一步的改进,包括关键词抽取,以及在句子相似度的定义中引入同义词以及近义词的情形。并以此