数据集是来源于UniversityofCalifornia,Irvine(UCI)机器学习数据库中的PimaIndianDiabetes数据集,总共包含768条数据项。这768个研究对象是来自于美国亚利桑那州的普通居民,由于在当地人口中糖尿病的发病率较高,美国国家糖尿病消化肾脏疾病研究所会对这个地区的人口进行持续性的调查研究。 数据集已转arff格式(其实与csv格式差不多可自行修改),可用于weka。