DSC维度诅咒ONL01 DTSC PT 052620 源码
维数的诅咒 介绍 维数的诅咒对于数据科学家来说是一个有趣的悖论。 一方面,人们经常希望获得更多信息,以提高机器学习算法的准确性。 但是,更大的数据集也伴随着一些有趣的现象。 尤其是,维数的诅咒是基于随着维数n的增加,n维空间的爆炸量。 目标 你将能够: 解释训练机器学习算法时维度诅咒的含义及其含义 N维空间中的稀疏性 随着维数的增加,n维空间中的点变得越来越稀疏。 也就是说,点之间的距离将随着尺寸数量的增加而继续增加。 在许多机器学习算法中,尤其是在将点聚类成组时,这可能会出现问题。 由于n维空间的爆炸性质,在为机器学习算法搜索最佳参数时,可能组合的数量也很多。 为了证明这一点,您将在接下来的实验中生成以下图表: 该图显示了点和原点之间的平均距离如何随着维数的增加而继续增长,即使每个维都有固定的范围。 简单地增加维数将继续使各个点越来越稀疏。 含义 诅咒维数的主要含义是,随着特征数量
文件列表
dsc-curse-of-dimensionality-onl01-dtsc-pt-052620-master.zip
(预估有个8文件)
dsc-curse-of-dimensionality-onl01-dtsc-pt-052620-master
images
sparsity.png
22KB
CONTRIBUTING.md
2KB
index.ipynb
4KB
LICENSE.md
1KB
.gitignore
64B
.learn
86B
README.md
4KB
.canvas
156B
暂无评论