A Criterion for Deciding the Number of Clusters in a Dataset Based on Data Depth
用于确定基于数据深度的数据集中的集群数量的标准 本文提出了一种新颖的思想,可以根据数据深度在数据集中找到正确的组数。 这样做的想法是避免传统的在数据集上运行聚类算法n ff次的过程,并且无需为k参数设置任何特定的搜索范围就可以找到数据集的k值。 我们在不同的真实和合成数据集上使用不同的索引(即CH,KL,Silhouette,Gap,CSP)和建议的方法进行实验,以估计数据集中的正确组数。 在真实和合成数据集上的实验结果表明了该方法的良好性能。 关键字:数据深度; 深度中位数集群内深度; 簇间深度; 最佳k。 Calinski and Harabasz(CH)指数,Calinski Harabasz指数,Davies Bouldin指数,肘法,估计D中的最佳簇数k,间隙统计,Mahalanobis深度,剪影系数,Silhouette指数
文件列表
A-Criterion-for-Deciding-the-Number-of-Clusters-in-a-Dataset-Based-on-Data-Depth-main.zip
(预估有个12文件)
A-Criterion-for-Deciding-the-Number-of-Clusters-in-a-Dataset-Based-on-Data-Depth-main
Gap_Statistic.py
2KB
Img
Readme.md
1B
Calinski_Harabasz_Index.py
1KB
Silhouette_Coefficient.py
1KB
LICENSE
11KB
Silhouette_Index.py
589B
.gitignore
2KB
Davies_Bouldin_Index.py
2KB
暂无评论