聚类问题 ​ 聚类问题是无监督学习,算法的思想是“物以类聚,人以群分”。聚类算法感知样本间的相似度,进行类别归纳,对新的输入进行输出预测,输出变量取有限个离散值。 可以作为一个单独的过程,用于寻找数据内在的分布结构。 可以作为分类、稀疏表示等其他学习任务的前驱过程 1.K-means ​ K-means(又称k-均值或k-平均)聚类算法。算法思想就是随机确定k个中心点作为聚类中心,然后把每个数据点分配给最邻近的中心点,分配完成后形成k个聚类,计算各个聚类的平均中心点,将其作为该聚类新的类中心点,然后重复迭代上述步骤直到分配过程不再产生变化。 算法流程: 1随机选择K个随机点(成为聚类中心) 2