在很多情况下,您需要根据某些条件执行INSERT,UPDATE或DELETE语句。我的问题是,对查询性能的影响是否在命令前添加了IF EXISTS。
例子
IF EXISTS(SELECT 1 FROM Contacs WHERE [Type] = 1) UPDATE Contacs SET [Deleted] = 1 WHERE [Type] = 1
INSERT或DELETE呢?
我不太确定,但是我得到的印象是,这个问题实际上是关于upsert的,它是以下原子操作:
UPDATE
INSERT
DELETE
开发人员转变为DBA常常天真地逐行编写它,如下所示:
-- For each row in source IF EXISTS(<target_expression>) IF @delete_flag = 1 DELETE <target_expression> ELSE UPDATE target SET <target_columns> = <source_values> WHERE <target_expression> ELSE INSERT target (<target_columns>) VALUES (<source_values>)
由于以下几个原因,这几乎是您可以做的最坏的事情:
它具有比赛条件。该行可以在IF EXISTS和之后的DELETE或之间消失UPDATE。
IF EXISTS
这很浪费。对于每笔交易,您都需要执行额外的操作;也许是微不足道的,但这完全取决于您的索引编制得如何。
最糟糕的是-它遵循的是迭代模型,在单行级别上考虑这些问题。这将对整体性能产生最大(最坏)的影响。
一个非常小的(我强调一点)的优化是UPDATE无论如何都要尝试。如果该行不存在,@@ROWCOUNT将为0,然后您可以“安全地”插入:
@@ROWCOUNT
-- For each row in source BEGIN TRAN UPDATE target SET <target_columns> = <source_values> WHERE <target_expression> IF (@@ROWCOUNT = 0) INSERT target (<target_columns>) VALUES (<source_values>) COMMIT
最坏的情况是,这仍将为每个事务执行两项操作,但至少有 机会 仅执行一项操作,而且还消除了竞争条件(这种情况)。
但是真正的问题是,仍然需要对源代码中的每一行执行此操作。
在SQL Server 2008之前,您必须使用笨拙的三阶段模型在设置级别上处理此问题(仍然优于逐行):
BEGIN TRAN INSERT target (<target_columns>) SELECT <source_columns> FROM source s WHERE s.id NOT IN (SELECT id FROM target) UPDATE t SET <target_columns> = <source_columns> FROM target t INNER JOIN source s ON t.d = s.id DELETE t FROM target t WHERE t.id NOT IN (SELECT id FROM source) COMMIT
就像我说的那样,性能还很差劲,但是仍然比单行一次的方法好很多。但是,SQL Server 2008最终引入了MERGE语法,因此现在您所要做的就是:
MERGE target USING source ON target.id = source.id WHEN MATCHED THEN UPDATE <target_columns> = <source_columns> WHEN NOT MATCHED THEN INSERT (<target_columns>) VALUES (<source_columns>) WHEN NOT MATCHED BY SOURCE THEN DELETE;
而已。一个声明。如果您使用的是SQL Server 2008,并且需要执行的任何顺序INSERT,UPDATE并且DELETE取决于该行是否已经存在- 即使只是一行 ,则 没有任何 理由不使用它MERGE。
MERGE
如果您需要随后查找完成的操作,甚至可以OUTPUT将受a影响的行MERGE放入表变量中。简单,快速且无风险。做吧
OUTPUT