我正在使用postgreSQL9.1,并且想使用此提示从表中删除重复项: 另一种可能的方式是
; --Ensure that any immediately preceding statement is terminated with a semicolon above WITH cte AS (SELECT ROW_NUMBER() OVER (PARTITION BY Col1, Col2, Col3 ORDER BY ( SELECT 0)) RN FROM #MyTable) DELETE FROM cte WHERE RN > 1;
我在ORDER BY (SELECT 0)上面使用,因为在打平的情况下保留哪一行是任意的。
为了保留最新的RowID顺序,例如,您可以使用ORDER BY RowID DESC
执行计划
执行计划通常比接受的答案更简单,更有效,因为它不需要自我连接。
但是,情况并非总是如此。一种GROUP BY可能是首选解决方案的地方是优先选择散列聚合而不是流聚合的情况。
该ROW_NUMBER解决方案将始终提供几乎相同的计划,而该GROUP BY策略则更为灵活。
可能支持散列聚合方法的因素是
分区列上没有有用的索引 相对较少的组,每组中重复项相对较多 在第二种情况的极端版本中(如果每个组中很少有很多重复的组),还可以考虑简单地将行插入以保存到新表中,然后TRUNCATE对原始行进行-ing并将其复制回去,以最大程度地减少日志记录,相比之下删除一个行的比例很高。
因此,我的查询如下所示:
WITH cte AS (SELECT ROW_NUMBER() OVER (PARTITION BY code, card_id, parent_id ORDER BY id DESC) RN FROM card) DELETE FROM cte WHERE RN > 1
但它告诉我
ERROR: relation "cte" does not exist SQL state: 42P01 Character: 157
但是,此语句可以正常工作:
WITH cte AS (SELECT ROW_NUMBER() OVER (PARTITION BY code, card_id, parent_id ORDER BY id DESC) RN FROM merchantcard) SELECT * FROM cte WHERE RN > 1
任何想法如何使它起作用?谢谢!
这是因为PostgreSQL中的CTE与SQL Server中的CTE工作方式不同。在SQLServer中,CTE就像一个可更新的视图,因此您可以从中删除或更新它们,而在PostgreSQL中则不能。
您可以加入cte和删除,例如:
with cte as ( select id, row_number() over(partition by code, card_id, parent_id order by id desc) as rn from card ) delete from card where id in (select id from cte where rn > 1)
另一方面,您可以在PostgreSQL的CTE中编写DDL语句(请参阅文档),这可能非常方便。例如,您可以从中删除所有行card,然后仅插入具有row_number = 1的行:
card
with cte1 as ( delete from card returning * ), cte2 as ( select row_number() over(partition by code, card_id, parent_id order by id desc) as rn, * from cte1 ) insert into card select <columns here> from cte2 where rn = 1