大数据至少具备以下三个特性:数据量巨大(volume),处理速度要求快(velocity),数据类型复杂繁多(variety)针对上面的三个特性,现在对volume与velocity的研究较多,而对 Variety的研究相对较少。 在Variety的研究上主要是使用度量空间来表示,,其具备高度的普遍适用性,但是在度量空间中没有坐标信息,很多平时使用的数学工具无法使用,因此需要对其度量空间内的数据进行坐标化,这样,即可实现传统的数学计算,例如计算距离,计算垂直平分线等等。而数据的坐标化依赖于支撑点的选取。因此支撑点对于度量空间模型中的数据管理和数据分析至关重要。 现在支撑点的选取有三大类问题: