t-SNE是一种经典的降维和可视化方法,是基于SNE(Stochastic Neighbor Embedding,随机近邻嵌入)做的,要了解t-SNE就要先了解SNE。本文同样既是总结,又是读论文笔记。 SNE 随机近邻嵌入 SNE的的第一步是用条件概率来表示高维空间中样本点之间用欧氏距离度量的相似度。假设样本选择其近邻的概率与与以自身为中心的高斯分布的概率密度成正比,SNE用pj∣ip_{j|i}pj∣i​来表示高维空间样本xix_ixi​会选择xjx_jxj​作为其近邻的概率,二范数距离越近,pj∣ip_{j|i}pj∣i​越大,二范数距离越远,pj∣ip_{j|i}pj∣i​越小。回忆一