spark运行聚类算法的数据集,分为train和test的数据格式,scv格式