目录散点图描述关系特征相关性协方差Pearson相关性非线性关系Spearman秩相关相关性和因果关系 之前提到过描述单个随机变量的一些工具,比如正针对整体总体细节的“分布”、针对总体概述的各种统计量(期望、方差等),也提到过针多元随机变量的描述量:协方差和相关系数,现在此总结下多个变量之间关系的研究。 散点图 研究两个变量之间关系的最简单方法是散点图(scatter plot)。但好的散点图的绘制并不简单。 注:可以将数据进行抖动(jittering),即加入随机噪音弥补四舍五入的效果,以减少丢失信息对散点图的影响。 但是,抖动数据通常只应用于视觉效果,你应该避免在分析时使用经过抖动处理的数