-博客- 此文件夹包含我的博客文件夹 博客1:关于数据科学 将“数据”转换为“洞察力”的科学已广为人知。 数据科学: : 数据科学家: : 博客2:聚类(有关其含义的第1部分) 聚类是将总体或数据点划分为多个组的任务,以使同一组中的数据点比其他组中的数据点更类似于同一组中的其他数据点。 简而言之,目的是将具有相似特征的群体隔离开来,并将其分配到集群中。 博客2:集群(第二部分:有监督学习与无监督学习) 在监督学习中,您使用“标签”正确的数据训练机器。 这意味着某些数据已经用正确答案进行了标记。 可以将其与在主管或老师在场的情况下进行的学习进行比较。 监督学习算法可从标记的训练数据