kd树数据结构实现k means聚类算法加速

soda12733 16 0 PDF 2021-01-19 19:01:52

主要的方法就是,将数据存储在kd树这种空间数据结构中,树的思想类似于二叉搜索树、红黑树等,真的很强大(相信童靴们明白的)。改进的k-means方法主要考虑了合理的初始候选质心的方式,并且利用kd树的特性,减少了循环计算欧式距离的次数,并且从Voronoi多边形得到的启发进行最近点计算和剪枝策略,实现的代码。运行证明在大量数据的情况下,算法的执行效率确实有很大改进。最后感谢Tapas Kanungo等的论文《An Efficient k-Means Clustering Algorithm:Analysis and Implementation》提供的算法思路和证明。实现代码见附件。

用户评论
请输入评论内容
评分:
暂无评论