针对现有聚类算法计算复杂度普遍较高的问题,提出了一种基于定位的方法.该算法采用空间定位的方法将数据对象映射到特征空间中,并利用空间立方体的某些特殊顶点定位任一数据点;通过计算数据点与空间立方体顶点群的距离差异,完成聚类过程.在电信数据集上的实验结果表明,算法的时间复杂度降至O(N)级别.
术基于定位的数据聚类新算法张舒博1,牛琨2(1.中国电信北京研究院决策研究部,北京100035;2.北京邮电大学网络与交换国家重点实验室,北京100876)摘要:针对现有聚类算法计算复杂度普遍较高的问题,提出了一种基于定位的方法。该算法采用空间定位的方法将数据对象映射到特征空间中,并利用空间立方体的某些特殊顶点定位任一数据点;通过计算数据点与空间立方体顶点群的距离差异,完成聚类过程。在电信数据集上的实验结果表明,算法的时间复杂度降至0(Ⅳ)级别。关键词:数据挖掘聚类定位法空间立方体随着人类社会信息化水平的不断提高,数据和信息的任何一个向量XEZ,X=(xl,x2,…,X肼),每个属性依次的增长速度越来越快。面对堆积如山的数据和信息,如按照公式置=(置一心啦)/(M似i一心m)(式中,i∈{l,2,…,何挖掘出有用的知识,便成为科学研究的焦点。聚类
暂无评论