小编典典

在Greenplum中发布通知

sql

假设我在psql上运行以下查询:

> select a.c1, b.c2 into temp_table from db.A as a inner join db.B as b 
> on a.x = b.x limit 10;

我收到以下消息:

注意:表没有’DISTRIBUTED BY’子句-使用名为’c1’的列作为该表的Greenplum数据库数据分配键。
提示:’DISTRIBUTED BY’子句确定数据的分布。确保选择的列是最佳数据分配键,以最大程度地减少偏斜。

  1. 什么是DISTRIBUTED BY专栏?
  2. temp_table存放在哪里?它存储在我的客户端还是服务器上?

阅读 133

收藏
2021-05-16

共1个答案

小编典典

  1. 分配依据是Greenplum如何确定将存储每一行​​的段。由于Greenplum在大多数生产数据库中都是MPP数据库,因此您将拥有多个段服务器。您要确保“分布”列是您将在美国加入的列。

  2. temp_table是将在Greenplum群集上为您创建的表。如果您尚未将search_path设置为其他名称,它将位于公共架构中。

2021-05-16