admin

删除了PostgreSQL的文件``不存在''。

sql

我正在使用postgreSQL9.1,并且想使用此提示从表中删除重复项:
另一种可能的方式是

; 

--Ensure that any immediately preceding statement is terminated with a semicolon above
WITH cte
     AS (SELECT ROW_NUMBER() OVER (PARTITION BY Col1, Col2, Col3 
                                       ORDER BY ( SELECT 0)) RN
         FROM   #MyTable)
DELETE FROM cte
WHERE  RN > 1;

我在ORDER BY (SELECT 0)上面使用,因为在打平的情况下保留哪一行是任意的。

为了保留最新的RowID顺序,例如,您可以使用ORDER BY RowID DESC

执行计划

执行计划通常比接受的答案更简单,更有效,因为它不需要自我连接。

执行计划

但是,情况并非总是如此。一种GROUP BY可能是首选解决方案的地方是优先选择散列聚合而不是流聚合的情况。

该ROW_NUMBER解决方案将始终提供几乎相同的计划,而该GROUP BY策略则更为灵活。

执行计划

可能支持散列聚合方法的因素是

分区列上没有有用的索引
相对较少的组,每组中重复项相对较多
在第二种情况的极端版本​​中(如果每个组中很少有很多重复的组),还可以考虑简单地将行插入以保存到新表中,然后TRUNCATE对原始行进行-ing并将其复制回去,以最大程度地减少日志记录,相比之下删除一个行的比例很高。

因此,我的查询如下所示:

WITH cte
 AS (SELECT ROW_NUMBER() 
 OVER (PARTITION BY code, card_id, parent_id 
     ORDER BY id DESC) RN
     FROM card)
DELETE FROM cte
WHERE RN > 1

但它告诉我

ERROR: relation "cte" does not exist
SQL state: 42P01
Character: 157

但是,此语句可以正常工作:

WITH cte
 AS (SELECT ROW_NUMBER() 
 OVER (PARTITION BY code, card_id, parent_id 
     ORDER BY id DESC) RN
     FROM merchantcard)
SELECT * FROM cte
WHERE RN > 1

任何想法如何使它起作用?谢谢!


阅读 184

收藏
2021-05-10

共1个答案

admin

这是因为PostgreSQL中的CTE与SQL Server中的CTE工作方式不同。在SQLServer中,CTE就像一个可更新的视图,因此您可以从中删除或更新它们,而在PostgreSQL中则不能。

您可以加入cte和删除,例如:

with cte as (
    select
        id,
        row_number() over(partition by code, card_id, parent_id order by id desc) as rn
    from card
)
delete
from card
where id in (select id from cte where rn > 1)

另一方面,您可以在PostgreSQL的CTE中编写DDL语句(请参阅文档),这可能非常方便。例如,您可以从中删除所有行card,然后仅插入具有row_number = 1的行:

with cte1 as (
    delete
    from card
    returning *
), cte2 as (
    select
        row_number() over(partition by code, card_id, parent_id order by id desc) as rn,
        *
    from cte1
)
insert into card
select <columns here>
from cte2
where rn = 1
2021-05-10