Greenplum(GP)是分布式数据库,因此,数据的分布是基础。GP提供了多种分布策略:哈希分布、随机分布和复制表。其中,最常用的就是哈希分布。本篇文章我将向大家介绍GP的哈希分布。首先,我们先回顾一下上篇文章用于调试的那张表: 大家可以看到建表语句末尾有DISTRIBUTEDBY(c1),这就表示上面这张表是一张哈希分布表,且通过列c1的值散列数据。我们再来看下表里的数据:因为psql默认连接的是Master,所以这里只能看到整张表的数据。如果我们想观察数据在Segment中的分布情况,那么有没有办法只看某个Segment