用于确定基于数据深度的数据集中的集群数量的标准 本文提出了一种新颖的思想,可以根据数据深度在数据集中找到正确的组数。 这样做的想法是避免传统的在数据集上运行聚类算法n ff次的过程,并且无需为k参数设置任何特定的搜索范围就可以找到数据集的k值。 我们在不同的真实和合成数据集上使用不同的索引(即CH,KL,Silhouette,Gap,CSP)和建议的方法进行实验,以估计数据集中的正确组数。 在真实和合成数据集上的实验结果表明了该方法的良好性能。 关键字:数据深度; 深度中位数集群内深度; 簇间深度; 最佳k。 Calinski and Harabasz(CH)指数,Calinski Harabasz指数,Davies Bouldin指数,肘法,估计D中的最佳簇数k,间隙统计,Mahalanobis深度,剪影系数,Silhouette指数