Lingras 提出的粗k 均值聚类算法易受随机初始聚类中心和离群点的影响, 可能出现一致性和无法收敛的聚 类结果. 对此, 提出一种改进的粗?? 均值算法, 选择潜能最大的k 个对象作为初始的聚类中心, 根据数据对象与聚类 中心的相对距离来确定其上下近似归属, 使边界区域的划分更合理. 定义了广义分类正确率, 该指标同时考虑了下近 似集和边界区域中的对象, 评价算法性能更准确. 仿真实验结果表明, 该算法分类正确率高, 收敛速度快, 能够克服离 群点的不利影响.