这个问题需要一些假设的背景。让我们考虑一个employee有列的表name,date_of_birth,title,salary,使用MySQL作为RDBMS。由于如果给定的某个人的名字和出生日期与另一个人相同,那么根据定义,他们就是同一个人(除非有两个巧合,即我们两个人分别于1809年2月12日出生,他们叫亚伯拉罕·林肯),所以我们将上的唯一键name,date_of_birth这意味着“不要将同一个人存储两次”。现在考虑以下数据:
employee
name
date_of_birth
title
salary
id name date_of_birth title salary 1 John Smith 1960-10-02 President 500,000 2 Jane Doe 1982-05-05 Accountant 80,000 3 Jim Johnson NULL Office Manager 40,000 4 Tim Smith 1899-04-11 Janitor 95,000
如果现在尝试运行以下语句,则该语句应该并且将失败:
INSERT INTO employee (name, date_of_birth, title, salary) VALUES ('Tim Smith', '1899-04-11', 'Janitor', '95,000')
如果我尝试此操作,它将成功:
INSERT INTO employee (name, title, salary) VALUES ('Jim Johnson', 'Office Manager', '40,000')
现在,我的数据将如下所示:
id name date_of_birth title salary 1 John Smith 1960-10-02 President 500,000 2 Jane Doe 1982-05-05 Accountant 80,000 3 Jim Johnson NULL Office Manager 40,000 4 Tim Smith 1899-04-11 Janitor 95,000 5 Jim Johnson NULL Office Manager 40,000
这不是我想要的,但是我不能说我完全不同意发生的事情。如果说数学集
{'Tim Smith', '1899-04-11'} = {'Tim Smith', '1899-04-11'} <-- TRUE {'Tim Smith', '1899-04-11'} = {'Jane Doe', '1982-05-05'} <-- FALSE {'Tim Smith', '1899-04-11'} = {'Jim Johnson', NULL} <-- UNKNOWN {'Jim Johnson', NULL} = {'Jim Johnson', NULL} <-- UNKNOWN
我的猜测是MySQL说:“由于我不 知道NULL出生日期的吉姆·约翰逊不在此表中,因此我将其添加。”
NULL
我的问题是: 即使date_of_birth并不总是知道如何防止重复?到目前为止,我想出的最好的办法是移到date_of_birth另一张桌子。但是,这样做的问题是,我最终可能会遇到两个出纳员,他们的名字,头衔和薪水相同,出生日期不同,而且没有重复的方式就无法存储它们。
唯一密钥的 基本属性是它必须是唯一的。使该键成为Nullable的一部分会破坏此属性。
有两种可能的解决方案来解决您的问题:
一种方法(错误的方法)是使用一些魔术日期来表示未知数。这只是使您克服了DBMS的“问题”,但并不能从逻辑上解决问题。预期两个“约翰·史密斯”条目的生日不明的问题。这些家伙是同一个人还是独特的个人?如果您知道它们不同,那么您又回到了同样的旧问题-您的唯一密钥不是唯一的。甚至不要考虑分配一个完整的魔术日期来表示“未知”,这确实是通往地狱的道路。
更好的方法是将EmployeeId属性创建为代理键。这只是您分配给 知道 唯一的个人的任意标识符。该标识符通常只是一个整数值。然后创建一个Employee表,以将EmployeeId(唯一的,不可为空的键)与您认为是依赖属性的属性相关联,在这种情况下,名称和出生日期(其中任何一个都可以为空)。在以前使用姓名/生日的任何地方使用EmployeeId代理键。这将向您的系统添加一个新表,但是以一种可靠的方式解决了未知值的问题。