频谱聚类包括两个不同的阶段:(a)从数据集中构造一个亲和图,以及(b)通过找到亲和图的最佳划分来聚类数据点。 本文的重点是第一步。 由于易于实现,现有的频谱聚类算法采用高斯函数来定义亲和图。 但是,高斯函数很难描述数据的固有结构,它必须指定缩放参数,其选择在频谱聚类中仍然是一个未解决的问题。 因此,我们从图分区的角度为光谱聚类提出了亲和图的新定义。 特别是,我们提出了两个一致性:平滑一致性和约束一致性,以便保持亲和图,然后在流形上的排序正则化框架中定义尊重这些一致性的亲和图。 同时,所提出的亲和图定义适用于无监督和半监督频谱聚类。 令人鼓舞的关于合成数据和真实世界数据的实验结果证明了该方法的有效性。 ? 2009爱思唯尔BV