本书前两部分主要探讨监督学习(supervisedlearning)。在监督学习的过程中,我们只需要给定输入样本集,机器就可以从中推演出指定目标变量的可能结果。监督学习相对比较简单,机器只需从输入数据中预测合适的模型,并从中计算出目标变量的结果。监督学习一般使用两种类型的目标变量:标称型和数值型。标称型目标变量的结果只在有限目标集中取值,如真与假、动物分类集合{爬行类、鱼类、哺乳类、两栖类、植物、真菌}数值型目标变量则可以从无限的数值集合中取值,如0.100、42.001、1000743等。数值型目标变量主要用于回归分析,将在本书的第二部分研究,第一部分主要介绍分类。本书的前七章主要研究分类算法,第2章讲述最简单的分类算法:k-近邻算法,它使用距离矩阵进行