我从谷歌搜索开始,发现这篇文章讨论了互斥表。
我有一张约有1400万条记录的表。如果我想添加更多相同格式的数据,是否有一种方法可以确保在不使用一对查询的情况下我要插入的记录不存在(即,要检查的一个查询和要插入的一个是结果集是空)?
如果unique字段上存在约束,是否可以保证该约束insert将失败?
unique
insert
似乎 只有 一个约束,当我通过php发出插入命令时,脚本就发出了嘶哑的声音。
采用 INSERT IGNORE INTO table
INSERT IGNORE INTO table
见http://bogdan.org.ua/2007/10/18/mysql-insert-if-not-exists- syntax.html
还有INSERT … ON DUPLICATE KEY UPDATE语法,您可以在dev.mysql.com上找到说明
INSERT … ON DUPLICATE KEY UPDATE
**根据 Google的webcache从bogdan.org.ua发布:**
2007年10月18日 首先:从最新的MySQL开始,标题中提供的语法是不可能的。但是,有几种非常简单的方法可以使用现有功能来完成预期的工作。 有3种可能的解决方案:使用INSERT IGNORE,REPLACE或INSERT…ON DUPLICATE KEY UPDATE。 假设我们有一张桌子: CREATE TABLE `transcripts` ( `ensembl_transcript_id` varchar(20) NOT NULL, `transcript_chrom_start` int(10) unsigned NOT NULL, `transcript_chrom_end` int(10) unsigned NOT NULL, PRIMARY KEY (`ensembl_transcript_id`) ) ENGINE=InnoDB DEFAULT CHARSET=latin1; 现在,假设我们有一个自动管道从Ensembl导入笔录元数据,并且由于各种原因,该管道在执行的任何步骤都可能会中断。因此,我们需要确保两件事: 重复执行管道不会破坏我们的数据库 重复执行不会因“主键重复”错误而死亡。 方法1:使用REPLACE 很简单: REPLACE INTO `transcripts` SET `ensembl_transcript_id` = 'ENSORGT00000000001', `transcript_chrom_start` = 12345, `transcript_chrom_end` = 12678; 如果记录存在,它将被覆盖;如果尚不存在,将创建它。但是,对于我们的情况,使用这种方法效率不高:我们不需要覆盖现有记录,只需要跳过它们就可以了。 方法2:使用INSERT IGNORE也很简单: INSERT IGNORE INTO `transcripts` SET `ensembl_transcript_id` = 'ENSORGT00000000001', `transcript_chrom_start` = 12345, `transcript_chrom_end` = 12678; 在这里,如果数据库中已经存在“ ensembl_transcript_id”,它将被静默跳过(忽略)。(更准确地说,这是MySQL参考手册的引文:“如果使用IGNORE关键字,则在执行INSERT语句时发生的错误将被视为警告。例如,在没有IGNORE的情况下,该行将复制现有的UNIQUE索引或表中的PRIMARY KEY值导致重复键错误,并且语句中止。”。如果记录尚不存在,则将创建该记录。 第二种方法有几个潜在的弱点,包括在发生任何其他问题时不放弃查询(请参见手册)。因此,如果以前没有使用IGNORE关键字进行测试,则应使用它。 方法3:使用INSERT…ON DUPLICATE KEY UPDATE: 第三种选择是使用INSERT … ON DUPLICATE KEY UPDATE 语法,在UPDATE部分中什么都不做,就没有任何意义(空),例如计算0 + 0(Geoffray建议对MySQL优化引擎执行id = id赋值,以忽略此操作)。此方法的优点是它仅忽略重复的键事件,并且在其他错误时仍然中止。 最后通知:这篇文章的灵感来自Xaprb。我还建议您咨询他的其他有关编写灵活的SQL查询的文章。
2007年10月18日
首先:从最新的MySQL开始,标题中提供的语法是不可能的。但是,有几种非常简单的方法可以使用现有功能来完成预期的工作。
有3种可能的解决方案:使用INSERT IGNORE,REPLACE或INSERT…ON DUPLICATE KEY UPDATE。
假设我们有一张桌子:
CREATE TABLE `transcripts` ( `ensembl_transcript_id` varchar(20) NOT NULL, `transcript_chrom_start` int(10) unsigned NOT NULL, `transcript_chrom_end` int(10) unsigned NOT NULL, PRIMARY KEY (`ensembl_transcript_id`) ) ENGINE=InnoDB DEFAULT CHARSET=latin1;
现在,假设我们有一个自动管道从Ensembl导入笔录元数据,并且由于各种原因,该管道在执行的任何步骤都可能会中断。因此,我们需要确保两件事:
重复执行管道不会破坏我们的数据库
重复执行不会因“主键重复”错误而死亡。
方法1:使用REPLACE
很简单:
REPLACE INTO `transcripts` SET `ensembl_transcript_id` = 'ENSORGT00000000001', `transcript_chrom_start` = 12345, `transcript_chrom_end` = 12678;
如果记录存在,它将被覆盖;如果尚不存在,将创建它。但是,对于我们的情况,使用这种方法效率不高:我们不需要覆盖现有记录,只需要跳过它们就可以了。
方法2:使用INSERT IGNORE也很简单:
INSERT IGNORE INTO `transcripts` SET `ensembl_transcript_id` = 'ENSORGT00000000001', `transcript_chrom_start` = 12345, `transcript_chrom_end` = 12678;
在这里,如果数据库中已经存在“ ensembl_transcript_id”,它将被静默跳过(忽略)。(更准确地说,这是MySQL参考手册的引文:“如果使用IGNORE关键字,则在执行INSERT语句时发生的错误将被视为警告。例如,在没有IGNORE的情况下,该行将复制现有的UNIQUE索引或表中的PRIMARY KEY值导致重复键错误,并且语句中止。”。如果记录尚不存在,则将创建该记录。
第二种方法有几个潜在的弱点,包括在发生任何其他问题时不放弃查询(请参见手册)。因此,如果以前没有使用IGNORE关键字进行测试,则应使用它。
方法3:使用INSERT…ON DUPLICATE KEY UPDATE:
第三种选择是使用INSERT … ON DUPLICATE KEY UPDATE 语法,在UPDATE部分中什么都不做,就没有任何意义(空),例如计算0 + 0(Geoffray建议对MySQL优化引擎执行id = id赋值,以忽略此操作)。此方法的优点是它仅忽略重复的键事件,并且在其他错误时仍然中止。
最后通知:这篇文章的灵感来自Xaprb。我还建议您咨询他的其他有关编写灵活的SQL查询的文章。