假设我在psql上运行以下查询:
> select a.c1, b.c2 into temp_table from db.A as a inner join db.B as b > on a.x = b.x limit 10;
我收到以下消息:
注意:表没有’DISTRIBUTED BY’子句-使用名为’c1’的列作为该表的Greenplum数据库数据分配键。 提示:’DISTRIBUTED BY’子句确定数据的分布。确保选择的列是最佳数据分配键,以最大程度地减少偏斜。
DISTRIBUTED BY
temp_table
分配依据是Greenplum如何确定将存储每一行的段。由于Greenplum在大多数生产数据库中都是MPP数据库,因此您将拥有多个段服务器。您要确保“分布”列是您将在美国加入的列。
temp_table是将在Greenplum群集上为您创建的表。如果您尚未将search_path设置为其他名称,它将位于公共架构中。