并行随机交换Java中高效可靠的聚类算法
解决大规模聚类问题需要一种也可以并行实现的高效算法.K均值是合适的但它可能导致聚类结果不准确.为了克服这个问题我们提出了随机交换聚类算法的并行版本.它结合了k均值的可扩展性和随机交换的高聚类精度.该算法在Java中以两种方式实现.第一个实现使用Java并行流和lambda表达式.该解决方案利用能够提供有竞争力的加速的内置多线程组织.第二个实现是在Theatre actor系统之上实现的该系统通过细粒度的资源控制确保更好的可扩展性和高性能计算.然后将这两种实现应用于标准基准数据集这些数据集具有不同的人口规模和管理记录的分布数据点的维度和聚类的数量.实验结果表明可以得到高质量的聚类并具有非常好的执行效率.
暂无评论