主成分分析由皮尔逊首先引入,后来被霍特林发展了。主成分分析是一种通过降维技术把多个变量化为少数几个主成分(综合变量)的统计分析方法。这些主成分能够反映原始变量的绝大部分信息,它们通常表示为原始变量的某种线性组合。为了实现最有效率的降维,应使这些主成分所含的信息(在线性关系的意义上)互不重叠,也就是要求它们之间互不相干。简言之,主成分分析就是一种用一组较少的不相关(综合)变量来代替大量相关变量的统计降维方法。