箱形图又称为盒须图,显示了一组数据的分散情况,可用来快速识别异常值。 (1)中位数:一组数据按顺序排列,居于中间位置的数,即为中位数。 如果这组数据一共有n个,X1,X2......Xn, 如果n为奇数,中位数则为X(n+1)/2 如果n为偶数,中位数则为中间两个数的平均值,(X(n/2)+X(n/2+1))/2 (2)上四分位数Qu:一组数据中有四分之一的数值比它大 (3)下四分位数Ql:一组数据中有四分之一的数值比它小 (4)四分位距Qr:Qu-Ql (5)上界:Qu+1.5Qr (6)下界:Ql-1.5Qr 此练习使用一份网上流传甚广的链家二手房数据,查看各区的二手房的单价和面价分布情况。 1