测量给定数据集相关性的算法,类似于Reddit