还在学习中!尚未补全 机器学习的学习任务根据训练集是否拥有标记信息, 可大致分为两类:监督学习和无监督学习 分类和回归是监督学习的代表 (对于预测的结果是离散值,例如“好瓜”“坏瓜”此称为分类;对于预测值是连续值,例如西瓜成熟度是0.95,此称为回归) 聚类是无监督学习的代表 (将训练集分为若干组,每组形成一个簇,他们自动形成的簇对应着一些潜在的特征划分,这些概念我们事先不知,这样的样本也不拥有标记) 模型评估方法 留出法 将数据集D分为互斥的两部分:训练集S、测试集T。 用训练集S进行训练后,通过测试集T来对泛化误差进行估计(一般训练集和测试集的划分尽可能保持数据分布的一致性) 交叉验证法