该数据集是比较权威的,可用于测试聚类、分类等算法。