这个项目的数据包含在customers.csv文件中.你能在UCI机器学习信息库https archive.ics.uci.edu ml datasets Wholesale customers页面中找到更多信息.在预测Region时使用聚类特征会使结果略微提升对于监督学习它是通过feature label的对来学习最后预测label对于非监督学习它只通过feature本身来学习最后能预测对应sample的label我们可以使用非监督学习的成果即得到的label来增强监督学习的结果利用这个label加入监督学习的input feature来给监督学习增维.我选择的聚类算法和两个聚类点与内在的旅馆餐馆咖啡店和零售商的分布相比有足够好根据这个分布cluster0可以划分成旅馆饭店咖啡馆cluster1可以划分成超市这个分类和前面我对于用户分类的定义一致.