机器学习实战之分类算法,机器学习就是将无序的数据转化为有用的信息。一个实例有 n 个特征,由 n 列组 成。机器学习最主要的任务就是分类,另一个就是回归,回归中比较典型的就是 线性拟合。分类和回归都属于监督学习,因为这类算法必须知道要预测什么,即 已知目标变量的分类信息。与监督学习对应的是无监督学习,此时数据没有类别 信息,也不会给定目标值,将数据集合分成由类似的对象组成的多个类的过程叫 做聚类。将描述数据统计值的过程称之为密度估计。分类首先要进行训练,训练 样本集必须确定目标变量的值,以便发现特征与目标变量之间的关系。特征或者 属性通常是训练样本集的列,他们是独立测量得到的结果,多个特征联系