利用Python进行数据分析——数据聚合与组操作
上图显示了一个分组背后的具体操作,当操作一个数据集按照某个key进行分组时,数据集首先会按组进行分割,然后再对每一组应用函数,最后返回分组后的结果。 当需要按照多个key进行分组时,给groupby()传递一个列表即可,得到的结果是具有层级index的Series: 当对整个数据集进行分组时,可以直接给groupby()传递key的值,此时不可再用loc()与iloc()方法,因为groupby()生成的是一个groupby对象,而不是DataFrame: