实时数据流聚类是目前国际数据库和数据管理领域的新兴研究热点。综述了实时数据流聚类的最新研究进展,在介绍实时数据流聚类的相关理论和常用技术的基础上,对现有各种代表性算法的优势和不足进行了系统地分析,从处理速度、聚类形状、演化分析、高维性及噪声健壮性5个方面对算法的性能进行了比较。探讨了基于聚类的实时数据流演化分析方法及其局限性。最后展望了将来可能的研究方向。