暂无评论
首先总结了链接挖掘中基于属性—链接聚类算法的研究现状;然后把它大体分为三类,对每一类中具有代表性的算法进行了详细介绍、分析和评价;最后指出了该领域进一步的研究方向。
基于用户会话的页面聚类算法旨在发现用户在浏览过程中频繁访问的页组,为站点管理员优化站点结构提供有力的依据。将介绍一种改进的基于频繁访问页组的路径聚类算法K-PathPlus,其中定义了新的兴趣度、内容
传统根据[K]-近邻图计算测地距离的方法,虽然能够发现流形分布数据间的相似关系,但是当不同类的点存在粘连关系时,依此计算相似度时不能体现样本间的真实关系,从而无法有效聚类。针对传统测地距离计算相似度的
在基于DEM的地形表面重构中,传统的插值方法(B样条插值、双线形插值)获取的地形表面过于平滑,不能反映自然地形具有无限细节的事实。引入3维迭代函数系统(3D-IFS)插值方法来重构经随机简化的原始地形
K均值聚类算法是目前一种较好的文本分类算法,算法中的相似度计算通常基于词频统计,小文档或简单句子由于词频过小,使用该算法聚类效果较差。为此,提出了一种基于词语关联度的相似度计算算法,对简单文档集执行
针对DBSCAN算法中最小点数和最大邻域半径难以确定、算法时间开销大、对起始数据点的选择比较敏感,以及难以发现不同密度下的邻近簇等问题,提出一种基于扩展区域查询的密度聚类算法(GISN-DBSCAN)
引入遗传算法试图解决海量、高维样本的聚类问题。分析了目前基于样本和属性值两类基于遗传算法的聚类算法的不足,归纳出它们的算法模型。针对多维快速聚类问题提出了密度法、网格法两种基于遗传算法的聚类算法。算法
多聚类中心近邻传播聚类算法(MEAP),在处理任意形状具有流形分布结构的数据时,往往得不到理想的聚类结果。为此,基于流形学习的思想,设计了一种全新的相似性度量,该相似性度量能够扩大位于同一流形中数据点
结合矩阵分析知识,还原了实施谱聚类算法过程中的矩阵表示。发现了不同数据输入顺序使得相应的Affinity矩阵及Laplacian矩阵是相似的。这样,Laplacian矩阵的特征向量生成的矩阵Y也是相似
由于稀疏性,直接聚类高维数据仍然是一个难题。 因此,通过降维获得它们的低维紧凑表示是对高维数据进行聚类的有效方法。 但是,大多数现有的降维方法最初都是为分类(例如线性判别分析)或恢复高维数据的几何结构
暂无评论